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ERRATA 


Vom menţine doar lista cu erorile importante. Există şi alte mici erori de formatare, care 
nu afectează însă inteligibilitatea textului. Suntem recunoscători tuturor celor care ne 
semnalează erori. 


Secţiunea 3.3, pg. 43, ultimul paragraf 
În loc de “T[2%], T[2k+l], T Tla, corect este “TE, T[2k+ 1],..., n2. 


Secțiunea 3.6, pg 53, exercițiul 3.5 


În loc de “i < 12”, corect este “i < 12”. 


Secţiunea 4.4, pg. 84, exerciţiul 4.1 


In loc de “alocareDinmica()”, corecteste "alocareDinamica ()”. 


Secţiunea 5.1.2, pg. 91 


In loc de “funcţie eventual nedescrescatoare”, mai corect este “funcţie în final 
nedescrescatoare”. 


Secţiunea 5.3, pg. 104 


În loc de “t, = c,42+ ck4“, corect este “t, = c 4 + c,k4“. 


Secţiunea 6.5, pg. 124, figura 6.3 


Frecvența de apariție pentru litera O este desigur 9. 


Secţiunea 6.6.2, pg. 128, tabelul 6.2 
La pasul 5, mulțimea U este (1,2, 3,4,5,7). 


Secţiunea 7.3, pg 153 
Algoritmul mergesort corect este: 


procedure mergesort(T|l .. n]) 
(sortează în ordine crescătoare tabloul T} 
if n este mic 
then insert(T) 
else arrays U[1 .. n div 2], V[1 .. (n+1) div 2] 
U & T[1 .. n div 2] 
V & T[1 + (n div 2)..n] 
mergesort(U), mergesort(V) 
merge(T, U, V) 


Secţiunea 7.10, pg. 178 


Soluţia corectă la exercițiul 7.6 este: 


function patrar(a, b, n) 
if a = b-1 then return a 
m <+ (a+b) div 2 
ifm’ <n then return patrat(m, b, n) 
else return patrat(a, m, n) 


Secţiunea 8.2, pg. 188, figura 8.1 
În loc de “P(i-1, j-2)”, corect este “P(i, j-2)”. 
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Cuvânt înainte 


Evoluţia rapidă şi spectaculoasă a informaticii în ultimile decenii se reflectă atât 
în apariţia a numeroase limbaje de programare, cât şi în metodele de elaborare şi 
redactare a unor algoritmi performanțţi. 


Un concept nou, care s-a dovedit foarte eficient, este cel al programării orientate 
pe obiect, prin obiect înțelegându-se o entitate ce cuprinde atât datele, cât şi 
procedurile ce operează cu ele. Dintre limbajele orientate pe obiect, limbajul C++ 
prezintă — printre multe altele — avantajul unei exprimări concise, fapt ce ușurează 
transcrierea în acest limbaj a algoritmilor redactaţi în pseudo-cod și motivează 
folosirea lui în cartea de față. Cu toate că nu este descris în detaliu, este demn de 
menționat faptul că descrierea din Capitolul 2, împreună cu completările din 
celelalte capitole, constituie o prezentare aproape integrală a limbajului C++. 


O preocupare meritorie a acestei lucrări este problema analizei eficienţei 
algoritmilor. Prezentarea acestei probleme începe în Capitolul 1 şi continuă în 
Capitolul 5. Tehnicile de analiză expuse se bazează pe diferite metode, prezentate 
într-un mod riguros şi accesibil. Subliniem contribuţia autorilor în expunerea 
detailată a inducției constructive şi a tehnicilor de rezolvare a recurenţelor liniare. 


Diferitele metode clasice de elaborare a algoritmilor sunt descrise în Capitolele 
6-8 prin probleme ce ilustrează foarte clar ideile de bază şi detaliile metodelor 
expuse. Pentru majoritatea problemelor tratate, este analizată şi eficiența 
algoritmului folosit. Capitolul 9 este consacrat tehnicilor de explorări în grafuri. 
În primele secţiuni sunt prezentate diferite probleme privind parcurgerea 
grafurilor. Partea finală a capitolului este dedicată jocurilor și cuprinde algoritmi 
ce reprezintă — de fapt — soluţii ale unor probleme de inteligenţă artificială. 


Cartea este redactată clar şi riguros, tratând o arie largă de probleme din domeniul 
elaborării şi analizei algoritmilor. Exerciţiile din încheierea fiecărui capitol sunt 
foarte bine alese, multe din ele fiind însoţite de soluții. De asemenea, merită 
menţionate referirile interesante la istoria algoritmilor și a gândirii algoritmice. 


Considerăm că această carte va fi apreciată şi căutată de către toţi cei ce lucrează 
în domeniul abordat și doresc să-l cunoască mai bine. 


Leon Livovschi 


In clipa când exprimăm un lucru, reuşim, 
în mod bizar, să-l și depreciem. 


Maeterlinck 


Prefață 


Cartea noastră îşi propune în primul rând să fie un curs şi nu o “enciclopedie” de 
algoritmi. Pornind de la structurile de date cele mai uzuale şi de la analiza 
eficienţei algoritmilor, cartea se concentrează pe principiile fundamentale de 
elaborare a algoritmilor: greedy, divide et impera, programare dinamică, 
backtracking. Interesul nostru pentru inteligenţa artificială a făcut ca penultimul 
capitol să fie, de fapt, o introducere — din punct de vedere al algoritmilor — în 
acest domeniu. 


Majoritatea algoritmilor selectaţi au o conotație estetică. Efortul necesar pentru 
înțelegerea elementelor mai subtile este uneori considerabil. Ce este însă un 
algoritm “estetic”? Putem răspunde foarte simplu: un algoritm este estetic dacă 
exprimă mult în cuvinte puţine. Un algoritm estetic este oare în mod necesar şi 
eficient? Cartea răspunde şi acestor întrebări. 


În al doilea rând, cartea prezintă mecanismele interne esenţiale ale limbajului C++ 
(moşteniri, legături dinamice, clase parametrice, excepţii) şi tratează 
implementarea algoritmilor în conceptul programării orientate pe obiect. Totuşi, 
această carte nu este un curs complet de C++. 


Algoritmii nu sunt pur şi simplu “transcrişi” din pseudo-cod în limbajul C++, ci 
sunt regândiți din punct de vedere al programării orientate pe obiect. Sperăm că, 
după citirea cărții, veţi dezvolta aplicaţii de programare orientată pe obiect și veţi 
elabora implementări ale altor structuri de date. Programele” au fost scrise pentru 
limbajul C++ descris de Ellis şi Stroustrup în “The Annotated C++ Reference 
Manual”. Acest limbaj se caracterizează, în principal, prin introducerea claselor 
parametrice şi a unui mecanism de tratare a excepțiilor foarte avansat, facilități 
deosebit de importante pentru dezvoltarea de biblioteci C++. Compilatoarele 
GNU C++ 2.5.8 (UNIX/Linux) și Borland C++ 3.1 (DOS) suportă destul de bine 
clasele parametrice. Pentru tratarea excepțiilor se pot utiliza compilatoarele 
Borland C++ 4.0 şi, în viitorul apropiat, GNU C++ 2.7.1. 


Fără a face concesii rigorii matematice, prezentarea este intuitivă, cu numeroase 
exemple. Am evitat, pe cât posibil, situaţia în care o carte de informatică începe — 


Fişierele sursă ale tuturor exemplelor — aproximativ 3400 de linii în 50 de fişiere — pot fi obținute 
pe o dischetă MS-DOS, printr-o comandă adresată editurii. 
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spre disperarea ne-matematicienilor — cu celebrul “Fie ... ”, sau cu o definiție. Am 
încercat, pe de altă parte, să evităm situaţia când totul “este evident”, sau “se 
poate demonstra”. Fiecare capitol este conceput fluid, ca o mică poveste, cu 
puţine referinţe și note. Multe rezultate mai tehnice sunt obţinute ca exerciţii. 
Algoritmii sunt prezentaţi într-un limbaj pseudo-cod compact, fără detalii inutile. 
Am adăugat la sfârşitul fiecărui capitol numeroase exerciții, multe din ele cu 


soluţii. 


Presupunem că cititorul are la bază cel puţin un curs introductiv în programare, 
nefiindu-i străini termeni precum algoritm, recursivitate, funcţie, procedură și 
pseudo-cod. Există mai multe modalităţi de parcurgere a cărţii. În funcţie de 
interesul şi pregătirea cititorului, acesta poate alege oricare din părțile referitoare 
la elaborarea, analiza, sau implementarea algoritmilor. Cu excepţia părților de 
analiză a eficienţei algoritmilor (unde sunt necesare elemente de matematici 
superioare), cartea poate fi parcursă şi de către un elev de liceu. Pentru 
parcurgerea  secțiunilor de implementare, este  recomandabilă cunoașterea 
limbajului C. 


Cartea noastră se bazează pe cursurile pe care le ţinem, începând cu 1991, la 
Secţia de electronică şi calculatoare a Universităţii Transilvania din Braşov. S-a 
dovedit utilă şi experienţa noastră de peste zece ani în dezvoltarea produselor 
software. Colectivul de procesare a imaginilor din ITC Braşov a fost un excelent 
mediu în care am putut să ne dezvoltăm profesional. Le mulțumim pentru aceasta 
celor care au făcut parte, alături de noi, din acest grup: Sorin Cismaş, Ștefan 
Jozsa, Eugen Carai. Nu putem să nu ne amintim cu nostalgie de compilatorul C al 
firmei DEC (pentru minicalculatoarele din seria PDP-11) pe care l-am 
“descoperit” împreună, cu zece ani în urmă. 


Ca de obicei în astfel de situaţii, numărul celor care au contribuit într-un fel sau 
altul la realizarea acestei cărți este foarte mare, cuprinzând profesorii noştri, 
colegii de catedră, studenții pe care am “testat” cursurile, prietenii. Le mulțumim 
tuturor. De asemenea, apreciem răbdarea celor care ne-au suportat în cei peste doi 
ani de elaborare a cărții. 


Sperăm să citiți această carte cu aceeaşi plăcere cu care ea a fost scrisă. 


Braşov, ianuarie 1995 
Răzvan Andonie 


Ilie Gârbacea” 


Autorii pot fi contactaţi prin poştă, la adresa: Universitatea Transilvania, Catedra de electronică şi 
calculatoare, Politehnicii 1-3, 2200 Braşov, sau prin E-mail, la adresa: algoritmi&c++@l1bvi.sfos.ro 
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1. Preliminarii 


1.1 Ce este un algoritm? 


Abu Jafar Mohammed ibn Musâ al-Khowârizm? (autor persan, sec. VIII-IX), a 
scris o carte de matematică cunoscută în traducere latină ca “Algorithmi de 
numero indorum”, iar apoi ca “Liber algorithmi”, unde “algorithm” provine de la 
“al-Khowârizmî”, ceea ce literal înseamnă “din oraşul Khowârizm”. În prezent, 
acest oraş se numeşte Khiva şi se află în Uzbechistan. Atât al-Khowârizmi, cât şi 
alți matematicieni din Evul Mediu, înțelegeau prin algoritm o regulă pe baza 
căreia se efectuau calcule aritmetice. Astfel, în timpul lui Adam Riese (sec. XVI), 
algoritmii foloseau la: dublări, înjumătățiri, înmulţiri de numere. Alţi algoritmi 
apar în lucrările lui Stifer (“Arithmetica integra”, Niirnberg, 1544) şi Cardano 
(“Ars magna sive de reguli algebraicis”, Nürnberg, 1545). Chiar şi Leibniz 
vorbește de “algoritmi de înmulţire”. Termenul a rămas totuşi multă vreme cu o 
întrebuințare destul de restrânsă, chiar și în domeniul matematicii. 


Kronecker (în 1886) şi Dedekind (în 1888) semnează actul de naștere al teoriei 
funcţiilor recursive. Conceptul de recursivitate devine indisolubil legat de cel de 
algoritm. Dar abia în deceniile al treilea şi al patrulea ale secolului nostru, teoria 
recursivităţii şi algoritmilor începe să se constituie ca atare, prin lucrările lui 
Skolem, Ackermann, Sudan, Gödel, Church, Kleene, Turing, Peter și alţii. 


Este surprinzătoare transformarea gândirii algoritmice, dintr-un instrument 
matematic particular, într-o modalitate fundamentală de abordare a problemelor în 
domenii care aparent nu au nimic comun cu matematica. Această universalitate a 
gândirii algoritmice este rezultatul conexiunii dintre algoritm şi calculator. Astăzi, 
înţelegem prin algoritm o metodă generală de rezolvare a unui anumit tip de 
problemă, metodă care se poate implementa pe calculator. În acest context, un 
algoritm este esenţa absolută a unei rutine. 


Cel mai faimos algoritm este desigur algoritmul lui Euclid pentru aflarea celui mai 
mare divizor comun a două numere întregi. Alte exemple de algoritmi sunt 
metodele învăţate în şcoală pentru a înmulți/împărți două numere. Ceea ce dă însă 
generalitate noţiunii de algoritm este faptul că el poate opera nu numai cu numere. 
Există astfel algoritmi algebrici şi algoritmi logici. Până şi o reţetă culinară este 
în esenţă un algoritm. Practic, s-a constatat că nu există nici un domeniu, oricât ar 
părea el de imprecis şi de fluctuant, în care să nu putem descoperi sectoare 
funcționând algoritmic. 


2 Preliminarii Capitolul 1 


Un algoritm este compus dintr-o mulțime finită de paşi, fiecare necesitând una sau 
mai multe operaţii. Pentru a fi implementabile pe calculator, aceste operaţii 
trebuie să fie în primul rând definite, adică să fie foarte clar ce anume trebuie 
executat. În al doilea rând, operaţiile trebuie să fie efective, ceea ce înseamnă că — 
în principiu, cel puţin — o persoană dotată cu creion şi hârtie trebuie să poată 
efectua orice pas într-un timp finit. De exemplu, aritmetica cu numere întregi este 
efectivă. Aritmetica cu numere reale nu este însă efectivă, deoarece unele numere 
sunt exprimabile prin secvenţe infinite. Vom considera că un algoritm trebuie să 
se termine după un număr finit de operaţii, într-un timp rezonabil de lung. 


Programul este exprimarea unui algoritm într-un limbaj de programare. Este bine 
ca înainte de a învăța concepte generale, să fi acumulat deja o anumită experienţă 
practică în domeniul respectiv. Presupunând că aţi scris deja programe într-un 
limbaj de nivel înalt, probabil că aţi avut uneori dificultăţi în a formula soluţia 
pentru o problemă. Alteori, poate că nu aţi putut decide care dintre algoritmii care 
rezolvau aceeași problemă este mai bun. Această carte vă va învăţa cum să evitați 
aceste situaţii nedorite. 


Studiul algoritmilor cuprinde mai multe aspecte: 


i) Elaborarea algoritmilor. Actul de creare a unui algoritm este o artă care nu 
va putea fi niciodată pe deplin automatizată. Este în fond vorba de 
mecanismul universal al creativităţii umane, care produce noul printr-o 
sinteză extrem de complexă de tipul: 

tehnici de elaborare (reguli) + creativitate (intuiţie) = soluție. 
Un obiectiv major al acestei cărți este de a prezenta diverse tehnici 
fundamentale de elaborare a algoritmilor. Utilizând aceste tehnici, acumulând 
şi o anumită experienţă, veţi fi capabili să concepețţi algoritmi eficienţi. 

ii) Exprimarea algoritmilor. Forma pe care o ia un algoritm într-un program 
trebuie să fie clară şi concisă, ceea ce implică utilizarea unui anumit stil de 
programare. Acest stil nu este în mod obligatoriu legat de un anumit limbaj de 
programare, ci, mai curând, de tipul limbajului şi de modul de abordare. 
Astfel, începând cu anii ‘80, standardul unanim acceptat este cel de 
programare structurată. În prezent, se impune standardul programării 
orientate pe obiect. 


iii) Validarea algoritmilor. Un algoritm, după elaborare, nu trebuie în mod 
necesar să fie programat pentru a demonstra că funcţionează corect în orice 
situaţie. El poate fi scris iniţial într-o formă precisă oarecare. În această 
formă, algoritmul va fi validat, pentru a ne asigura că algoritmul este corect, 
independent de limbajul în care va fi apoi programat. 


iv) Analiza algoritmilor. Pentru a putea decide care dintre algoritmii ce rezolvă 
aceeași problemă este mai bun, este nevoie să definim un criteriu de apreciere 
a valorii unui algoritm. În general, acest criteriu se referă la timpul de calcul 
şi la memoria necesară unui algoritm. Vom analiza din acest punct de vedere 
toți algoritmii prezentaţi. 
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v) Testarea programelor. Aceasta constă din două faze: depanare (debugging) şi 
trasare (profiling). Depanarea este procesul executării unui program pe date 
de test și corectarea eventualelor erori. După cum afirma însă E. W. Dijkstra, 
prin depanare putem evidenția prezența erorilor, dar nu şi absența lor. O 
demonstrare a faptului că un program este corect este mai valoroasă decât o 
mie de teste, deoarece garantează că programul va funcţiona corect în orice 
situație. Trasarea este procesul executării unui program corect pe diferite 
date de test, pentru a-i determina timpul de calcul şi memoria necesară. 
Rezultatele obţinute pot fi apoi comparate cu analiza anterioară a 
algoritmului. 


Această enumerare serveşte fixării cadrului general pentru problemele abordate în 
carte: ne vom concentra pe domeniile i), ii) şi iv). 


Vom începe cu un exemplu de algoritm. Este vorba de o metodă, cam ciudată la 
prima vedere, de înmulţire a două numere. Se numeşte “înmulțirea a la russe”. 


Vom scrie deînmulțitul şi înmulțitorul (de exemplu 45 şi 19) unul lângă altul, 
formând sub fiecare câte o coloană, conform următoarei reguli: se împarte 
numărul de sub deînmulţit la 2, ignorând fracțiile, apoi se înmulțește cu 2 numărul 


45 19 19 
22 38 — 
11 76 76 
5 152 152 

2 304 — 

1 608 608 

855 


de sub înmulțitor. Se aplică regula, până când numărul de sub deînmultit este 1. În 
final, adunăm toate numerele din coloana înmulţitorului care corespund, pe linie, 
unor numere impare în coloana deînmulţitului. În cazul nostru, obţinem: 
19 + 76 + 152 + 608 = 855. 


Cu toate că pare ciudată, aceasta este tehnica folosită de hardware-ul multor 
calculatoare. Ea prezintă avantajul că nu este necesar să se memoreze tabla de 
înmulţire. Totul se rezumă la adunări şi înmulţiri/împărțiri cu 2 (acestea din urmă 
fiind rezolvate printr-o simplă decalare). 


Pentru a reprezenta algoritmul, vom utiliza un limbaj simplificat, numit 
pseudo-cod, care este un compromis între precizia unui limbaj de programare şi 
ușurința în exprimare a unui limbaj natural. Astfel, elementele esenţiale ale 
algoritmului nu vor fi ascunse de detalii de programare neimportante în această 
fază. Dacă sunteţi familiarizat cu un limbaj uzual de programare, nu veţi avea nici 
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o dificultate în a înțelege notaţiile folosite și în a scrie programul respectiv. 
Cunoaşteţi atunci şi diferența dintre o funcţie și o procedură. În notația pe care o 
folosim, o funcţie va returna uneori un tablou, o mulţime, sau un mesaj. Veţi 
înţelege că este vorba de o scriere mai compactă şi în funcţie de context veţi putea 
alege implementarea convenabilă. Vom conveni ca parametrii funcţiilor 
(procedurilor) să fie transmişi prin valoare, exceptând tablourile, care vor fi 
transmise prin adresa primului element. Notaţia folosită pentru specificarea unui 
parametru de tip tablou va fi diferită, de la caz la caz. Uneori vom scrie, de 
exemplu: 


procedure procl(T) 


atunci când tipul şi dimensiunile tabloului T sunt neimportante, sau când acestea 
sunt evidente din context. Într-un astfel de caz, vom nota cu 47 numărul de 
elemente din tabloului 7. Dacă limitele sau tipul tabloului sunt importante, vom 
scrie: 


procedure proc2(T[1 .. n]) 
sau, mai general: 
procedure proc3(T[a .. b]) 
În aceste cazuri, n, a şi b vor fi consideraţi parametri formali. 


De multe ori, vom atribui unor elemente ale unui tablou T valorile +œ, înțelegând 
prin acestea două valori numerice extreme, astfel încât pentru oricare alt element 
T[i] avem —co < T[i] < +%. 


Pentru simplitate, vom considera uneori că anumite variabile sunt globale, astfel 
încât să le putem folosi în mod direct în proceduri. 


Iată acum și primul nostru algoritm, cel al înmulţirii “a la russe”: 
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function russe(A, B) 
arrays X, Y 
{inițializare } 
X[1] — A; Y[1] — B 
i — 1 {se construiesc cele două coloane} 
while X[i] > 1 do 
X[i+1] — X[i] div 2 (div reprezintă împărţirea întreagă) 
Y[i+1] e Y[i]+Y[i] 
iii 
{adună numerele Y[i] corespunzătoare numerelor X[i] impare) 
prod + 0 
while i > O do 
if X[i] este impar then prod + prod+Y[i] 
i e i-l 
return prod 


Un programator cu experiență va observa desigur că tablourile X şi Y nu sunt de 
fapt necesare şi că programul poate fi simplificat cu uşurinţă. Acest algoritm 
poate fi programat deci în mai multe feluri, chiar folosind același limbaj de 
programare. 


Pe lângă algoritmul de înmulţire învăţat în şcoală, iată că mai avem un algoritm 
care face acelaşi lucru. Există mai mulţi algoritmi care rezolvă o problemă, dar și 
mai multe programe care pot descrie un algoritm. 


Acest algoritm poate fi folosit nu doar pentru a înmulți pe 45 cu 19, dar şi pentru 
a înmulţi orice numere întregi pozitive. Vom numi (45, 19) un caz (instance). 
Pentru fiecare algoritm există un domeniu de definiţie al cazurilor pentru care 
algoritmul funcţionează corect. Orice calculator limitează mărimea cazurilor cu 
care poate opera. Această limitare nu poate fi însă atribuită algoritmului respectiv. 
Încă o dată, observăm că există o diferenţă esenţială între programe şi algoritmi. 


1.2 Eficiența algoritmilor 


Ideal este ca, pentru o problemă dată, să găsim mai mulți algoritmi, iar apoi să-l 
alegem dintre aceştia pe cel optim. Care este însă criteriul de comparaţie? 
Eficienţa unui algoritm poate fi exprimată în mai multe moduri. Putem analiza a 
posteriori (empiric) comportarea algoritmului după implementare, prin rularea pe 
calculator a unor cazuri diferite. Sau, putem analiza a priori (teoretic) algoritmul, 
înaintea programării lui, prin determinarea cantitativă a resurselor (timp, memorie 
etc) necesare ca o funcție de mărimea cazului considerat. 


Mărimea unui caz x, notată cu | x |, corespunde formal numărului de biți necesari 
pentru reprezentarea lui x, folosind o codificare precis definită şi rezonabil de 
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compactă. Astfel, când vom vorbi despre sortare, |x | va fi numărul de elemente 
de sortat. La un algoritm numeric, | x | poate fi chiar valoarea numerică a cazului 
X; 


Avantajul analizei teoretice este faptul că ea nu depinde de calculatorul folosit, de 
limbajul de programare ales, sau de îndemânarea programatorului. Ea salvează 
timpul pierdut cu programarea şi rularea unui algoritm care se dovedește în final 
ineficient. Din motive practice, un algoritm nu poate fi testat pe calculator pentru 
cazuri oricât de mari. Analiza teoretică ne permite însă studiul eficienței 
algoritmului pentru cazuri de orice mărime. 


Este posibil să analizăm un algoritm şi printr-o metodă hibridă. În acest caz, 
forma funcției care descrie eficiența algoritmului este determinată teoretic, iar 
valorile numerice ale parametrilor sunt apoi determinate empiric. Această metodă 
permite o predicție asupra comportării algoritmului pentru cazuri foarte mari, care 
nu pot fi testate. O extrapolare doar pe baza testelor empirice este foarte 
imprecisă. 


Este natural să întrebăm ce unitate trebuie folosită pentru a exprima eficiența 
teoretică a unui algoritm. Un răspuns la această problemă este dat de principiul 
invarianţei, potrivit căruia două implementări diferite ale aceluiaşi algoritm nu 
diferă în eficiență cu mai mult de o constantă multiplicativă. Adică, presupunând 
că avem două implementări care necesită t; (n) şi, respectiv, t(n) secunde pentru a 


rezolva un caz de mărime n, atunci există întotdeauna o constantă pozitivă c, 
astfel încât t(n) < ct (n) pentru orice n suficient de mare. Acest principiu este 


valabil indiferent de calculatorul (de construcție convențională) folosit, indiferent 
de limbajul de programare ales şi indiferent de îndemânarea programatorului 
(presupunând că acesta nu modifică algoritmul!). Deci, schimbarea calculatorului 
ne poate permite să rezolvăm o problemă de 100 de ori mai repede, dar numai 
modificarea algoritmului ne poate aduce o îmbunătățire care să devină din ce în ce 
mai marcantă pe măsură ce mărimea cazului soluționat creşte. 


Revenind la problema unității de măsură a eficienței teoretice a unui algoritm, 
ajungem la concluzia că nici nu avem nevoie de o astfel de unitate: vom exprima 
eficiența în limitele unei constante multiplicative. Vom spune că un algoritm 
necesită timp în ordinul lui t, pentru o funcție t dată, dacă există o constantă 
pozitivă c şi o implementare a algoritmului capabilă să rezolve fiecare caz al 
problemei într-un timp de cel mult ct(n) secunde, unde n este mărimea cazului 
considerat. Utilizarea secundelor în această definiție este arbitrară, deoarece 
trebuie să modificăm doar constanta pentru a mărgini timpul la at(n) ore, sau bt(n) 
microsecunde. Datorită principiului invarianței, orice altă implementare a 
algoritmului va avea aceeaşi proprietate, cu toate că de la o implementare la alta 
se poate modifica constanta multiplicativă. În Capitolul 5 vom reveni mai riguros 
asupra acestui important concept, numit notație asimptotică. 
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Dacă un algoritm necesită timp în ordinul lui n, vom spune că necesită timp liniar, 
iar algoritmul respectiv putem să-l numim algoritm liniar. Similar, un algoritm 


este pătratic, cubic, polinomial, sau exponențial dacă necesită timp în ordinul lui 


23 k À : 
n, n` ,n , respectiv c”, unde k şi c sunt constante. 


Un obiectiv major al acestei cărți este analiza teoretică a eficienței algoritmilor. 
Ne vom concentra asupra criteriului timpului de execuție. Alte resurse necesare 
(cum ar fi memoria) pot fi estimate teoretic într-un mod similar. Se pot pune şi 
probleme de compromis memorie - timp de execuție. 


1.3 Cazul mediu și cazul cel mai nefavorabil 


Timpul de execuție al unui algoritm poate varia considerabil chiar şi pentru cazuri 
de mărime identică. Pentru a ilustra aceasta, vom considera doi algoritmi 
elementari de sortare a unui tablou T de n elemente: 


procedure insert(T[1 .. n]) 
for i — 2 to n do 
x T[i]; j | i-l 
while j > 0 and x < T[ j] do 
Iele TIJ] 
jel 
T[ j+1] x 
procedure select (T[1 .. n]) 
for i — 1 to n-1 do 
minj <— i, minx < T[i] 
for j — i+1 to n do 
if T[ j] < minx then minj & j 
minx 4+ T[ j] 
T[minj] — T[i] 
T[i] — minx 


Ideea generală a sortării prin inserție este să considerăm pe rând fiecare element 
al șirului și să îl inserăm în subşirul ordonat creat anterior din elementele 
precedente. Operația de inserare implică deplasarea spre dreapta a unei secvențe. 
Sortarea prin selecție lucrează altfel, plasând la fiecare pas câte un element direct 
pe poziţia lui finală. 


Fie U şi V două tablouri de n elemente, unde U este deja sortat crescător, iar V 
este sortat descrescător. Din punct de vedere al timpului de execuţie, V reprezintă 
cazul cel mai nefavorabil iar U cazul cel mai favorabil. 
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Vom vedea mai târziu că timpul de execuţie pentru sortarea prin selecţie este 
pătratic, independent de ordonarea iniţială a elementelor. Testul “if T[ j] < minx” 
este executat de tot atâtea ori pentru oricare dintre cazuri. Relativ micile variații 
ale timpului de execuţie se datorează doar numărului de executări ale atribuirilor 
din ramura then a testului. 


La sortarea prin inserţie, situaţia este diferită. Pe de o parte, insert(U) este foarte 
rapid, deoarece condiţia care controlează bucla while este mereu falsă. Timpul 
necesar este liniar. Pe de altă parte, inserr(V) necesită timp pătratic, deoarece 
bucla while este executată de i-l ori pentru fiecare valoare a lui i. (Vom analiza 
acest lucru în Capitolul 5). 


Dacă apar astfel de variaţii mari, atunci cum putem vorbi de un timp de execuţie 
care să depindă doar de mărimea cazului considerat? De obicei considerăm 
analiza pentru cel mai nefavorabil caz. Acest tip de analiză este bun atunci când 
timpul de execuţie al unui algoritm este critic (de exemplu, la controlul unei 
centrale nucleare). Pe de altă parte însă, este bine uneori să cunoaştem timpul 
mediu de execuţie al unui algoritm, atunci când el este folosit foarte des pentru 
cazuri diferite. Vom vedea că timpul mediu pentru sortarea prin inserţie este tot 
pătratic. În anumite cazuri însă, acest algoritm poate fi mai rapid. Există un 
algoritm de sortare (quicksort) cu timp pătratic pentru cel mai nefavorabil caz, dar 
cu timpul mediu în ordinul lui n log n. (Prin log notăm logaritmul într-o bază 
oarecare, lg este logaritmul în baza 2, iar In este logaritmul natural). Deci, pentru 
cazul mediu, quicksort este foarte rapid. 


Analiza comportării în medie a unui algoritm presupune cunoaşterea a priori a 
distribuţiei probabiliste a cazurilor considerate. Din această cauză, analiza pentru 
cazul mediu este, în general, mai greu de efecuat decât pentru cazul cel mai 
nefavorabil. 


Atunci când nu vom specifica pentru ce caz analizăm un algoritm, înseamnă că 
eficienţa algoritmului nu depinde de acest aspect (ci doar de mărimea cazului). 


1.4 Operatie elementară 


O operație elementară este o operaţie al cărei timp de execuţie poate fi mărginit 
superior de o constantă depinzând doar de particularitatea implementării 
(calculator, limbaj de programare etc). Deoarece ne interesează timpul de execuţie 
în limita unei constante multiplicative, vom considera doar numărul operaţiilor 
elementare executate într-un algoritm, nu şi timpul exact de execuţie al operaţiilor 
respective. 


Următorul exemplu este testul lui Wilson de primalitate (teorema care stă la baza 
acestui test a fost formulată inițial de Leibniz în 1682, reluată de Wilson în 1770 
şi demonstrată imediat după aceea de Lagrange): 
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function Wilson(n) 
{returnează true dacă şi numai dacă n este prim) 
if n divide ((n-1)!+ 1) then return true 
else return false 


Dacă considerăm calculul factorialului şi testul de divizibilitate ca operaţii 
elementare, atunci eficienţa testului de primalitate este foarte mare. Dacă 
considerăm că factorialul se calculează în funcţie de mărimea lui n, atunci 
eficienţa testului este mai slabă. La fel şi cu testul de divizibilitate. 


Deci, este foarte important ce anume definim ca operaţie elementară. Este oare 
adunarea o operaţie elementară? În teorie, nu, deoarece şi ea depinde de lungimea 
operanzilor. Practic, pentru operanzi de lungime rezonabilă (determinată de modul 
de reprezentare internă), putem să considerăm că adunarea este o operaţie 
elementară. Vom considera în continuare că adunările, scăderile, înmulţirile, 
împărțirile, operaţiile modulo (restul împărţirii întregi), operaţiile booleene, 
comparaţiile şi atribuirile sunt operaţii elementare. 


1.5 Dece avem nevoie de algoritmi eficienţi? 


Performanţele hardware-ului se dublează la aproximativ doi ani. Mai are sens 
atunci să investim în obţinerea unor algoritmi eficienți? Nu este oare mai simplu 
să așteptăm următoarea generaţie de calculatoare? 
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Să presupunem că pentru rezolvarea unei anumite probleme avem un algoritm 
exponențial și un calculator pe care, pentru cazuri de mărime n, timpul de rulare 
—4 x 
este de 10 x 2” secunde. Pentru n = 10, este nevoie de 1/10 secunde. Pentru 
n = 20, sunt necesare aproape 2 minute. Pentru n = 30, o zi nu este de ajuns, iar 
pentru n = 38, chiar şi un an ar fi insuficient. Cumpărăm un calculator de 100 de 
. . . . —6 : 

ori mai rapid, cu timpul de rulare de 10° x 2” secunde. Dar și acum, pentru 
n = 45, este nevoie de mai mult de un an! In general, dacă în cazul maginii vechi 
într-un timp anumit se putea rezolva problema pentru cazul n, pe noul calculator, 
în acest timp, se poate rezolva cazul n+7. 


Să presupunem acum că am găsit un algoritm cubic care rezolvă, pe calculatorul 


vechi, cazul de mărime n în 10° x n? secunde. În Figura 1.1, putem urmări cum 
evoluează timpul de rulare în funcție de mărimea cazului. Pe durata unei zile, 
rezolvăm acum cazuri mai mari decât 200, iar în aproximativ un an am putea 
rezolva chiar cazul n = 1500. Este mai profitabil să investim în noul algoritm 
decât într-un nou hardware. Desigur, dacă ne permitem să investim atât în 
software cât şi în hardware, noul algoritm poate fi rulat şi pe noua maşină. Curba 


-4 3 S e SRR i 
10 xn reprezintă această din urmă situaţie. 


Pentru cazuri de mărime mică, uneori este totuși mai rentabil să investim într-o 


timpul de 4 
calcul (sec.) 


10” la ozi 


l4 0 Oră 


2 
10 F : 
la un minut 


10 | a / / 10% E 
o secundă peá á A Și aa i 


| 30 25. 30. 35 40 mărimea 
/ e af cazului 


Figura 1.1 Algoritmi sau hardware? 
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nouă maşină, nu şi într-un nou algoritm. Astfel, pentru n = 10, pe maşina veche, 
algoritmul nou necesită 10 secunde, adică de o sută de ori mai mult decât 
algoritmul vechi. Pe vechiul calculator, algoritmul nou devine mai performant 
doar pentru cazuri mai mari sau egale cu 20. 


1.6 Exemple 


Poate că vă întrebaţi dacă este într-adevăr posibil să accelerăm atât de spectaculos 
un algoritm. Răspunsul este afirmativ şi vom da câteva exemple. 


1.6.1 Sortare 


Algoritmii de sortare prin inserție şi prin selecţie necesită timp pătratic, atât în 
cazul mediu, cât şi în cazul cel mai nefavorabil. Cu toate că aceşti algoritmi sunt 
excelenți pentru cazuri mici, pentru cazuri mari avem algoritmi mai eficienţi. În 
capitolele următoare vom analiza și alți algoritmi de sortare: heapsort, mergesort, 
quicksort. Toţi aceştia necesită un timp mediu în ordinul lui n log n, iar heapsort 
şi mergesort necesită timp în ordinul lui n log n şi în cazul cel mai nefavorabil. 


Pentru a ne face o idee asupra diferenţei dintre un timp pătratic şi un timp în 
ordinul lui n log n, vom menţiona că, pe un anumit calculator, quicksort a reuşit 
să sorteze în 30 de secunde 100.000 de elemente, în timp ce sortarea prin inserție 
ar fi durat, pentru același caz, peste nouă ore. Pentru un număr mic de elemente 
însă, eficienţa celor două sortări este asemănătoare. 


1.6.2 Calculul determinanţilor 


Fie det( M ) determinantul matricii 
M = (aii = ln 


şi fie M, submatricea de (n-1) x (n-1) elemente, obţinută din M prin ştergerea 
celei de-a i-a linii și celei de-a j-a coloane. Avem binecunoscuta definiţie 
recursivă 


n 
j+ 
det( M ) = $ (1) 7t" a; ; det( M, ;) 
j=l 
Dacă folosim această relație pentru a evalua determinantul, obținem un algoritm 


cu timp în ordinul lui n!, ceea ce este mai rău decât exponențial. O altă metodă 
clasică, eliminarea Gauss-Jordan, necesită timp cubic. Pentru o anumită 
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implementare s-a estimat că, în cazul unei matrici de 20 x 20 elemente, în timp ce 
algoritmul Gauss-Jordan durează 1/20 secunde, algoritmul recursiv ar dura mai 
mult de 10 milioane de ani! 


Nu trebuie trasă de aici concluzia că algoritmii recursivi sunt în mod necesar 
neperformanțţi. Cu ajutorul algoritmului recursiv al lui Strassen, pe care îl vom 
studia şi noi în Secţiunea 7.8, se poate calcula det( M ) într-un timp în ordinul lui 


n (A unde lg 7 = 2,81, deci mai eficient decât prin eliminarea Gauss-Jordan. 


1.6.3 Cel mai mare divizor comun 


Un prim algoritm pentru aflarea celui mai mare divizor comun al întregilor 
pozitivi m şi n, notat cu cmmdc(m, n), se bazează pe definiţie: 


function cmmdc-def (m, n) 
i — min(m, n) +1 
repeat i — i-l until i divide pe m şi n 
return i 


Timpul este în ordinul diferenţei dintre min(m, n) şi cmmdc(m, n). 


Există, din fericire, un algoritm mult mai eficient, care nu este altul decât celebrul 
algoritm al lui Euclid. 


function Euclid(m, n) 
ifn =0 then return m 
else return Euclid(n, m mod n) 


Prin m mod n notăm restul împărţirii întregi a lui m la n. Algoritmul funcţionează 
pentru orice întregi nenuli m şi n, având la bază cunoscuta proprietate 


ecmmdc(m, n) = cmmdc(n, m mod n) 


Timpul este în ordinul logaritmului lui min(m, n), chiar şi în cazul cel mai 
nefavorabil, ceea ce reprezintă o îmbunătăţire substanţială față de algoritmul 
precedent. Pentru a fi exacţi, trebuie să menţionăm că algoritmul originar al lui 
Euclid (descris în “Elemente”, aprox. 300 a.Ch.) operează prin scăderi succesive, 
şi nu prin împărţire. Interesant este faptul că acest algoritm se pare că provine 
dintr-un algoritm şi mai vechi, datorat lui Eudoxus (aprox. 375 a.Ch.). 


1.6.4 Numerele lui Fibonacci 


Şirul lui Fibonacci este definit prin următoarea recurenţă: 
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E fii 


În > În F fn pentru n22 


Acest celebru şir a fost descoperit în 1202 de către Leonardo Pisano (Leonardo 
din Pisa), cunoscut sub numele de Leonardo Fibonacci. Cel de-al n-lea termen al 
şirului se poate obţine direct din definiţie: 


function fib1(n) 
ifn <2 then returnn 
else return fibl(n—1) + fibl(n—2) 
Această metodă este foarte ineficientă, deoarece recalculează de mai multe ori 


aceleași valori. Vom arăta în Secţiunea 5.3.1 că timpul este în ordinul lui 6", unde 


= (1+ J5 )/2 este secțiunea de aur, deci este un timp exponențial. 


Iată acum o altă metodă, mai performantă, care rezolvă aceeaşi problemă într-un 
timp liniar. 


function fib2(n) 
ie l;j-0 
for k e 1 tondo je i+j 
i—j-i 
return j 
Mai mult, există şi un algoritm cu timp în ordinul lui log n, algoritm pe care îl 
vom argumenta însă abia în Capitolul 7: 


function fib3(n) 
ie l;je0;ke0;héel 
while n > 0 do 
if n este impar then t< jh 


j — ih+jk+t 
i — ik+t 
tek 
h — 2kh+t 
ke kt 
n < n div 2 
return j 


Vă recomandăm să comparați aceşti trei algoritmi, pe calculator, pentru diferite 
valori ale lui n. 
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1.7 Exercitii 


1.1 Aplicați algoritmii insert şi select pentru cazurile T= [1, 2, 3, 4, 5, 6] şi 
U = [6, 5, 4, 3, 2, 1]. Asiguraţi-vă că ați înțeles cum funcționează. 


1.2 Înmulțirea “a la russe” este cunoscută încă din timpul Egiptului antic, 
fiind probabil un algoritm mai vechi decât cel al lui Euclid. Incercaţi să înţelegeţi 
raţionamentul care stă la baza acestui algoritm de înmulţire. 


Indicaţie: Faceţi legătura cu reprezentarea binară. 
1.3 În algoritmul Euclid, este important ca n > m ? 


1.4 Elaboraţi un algoritm care să returneze cel mai mare divizor comun a trei 
întregi nenuli. 


Soluţie: 


function Euclid-trei(m, n, p) 
return Euclid(m, Euclid(n, p)) 


1.5 Programaţi algoritmul fibl în două limbaje diferite şi rulaţi comparativ 
cele două programe, pe mai multe cazuri. Verificaţi dacă este valabil principiul 
invarianţei. 


1.6 Elaboraţi un algoritm care returnează cel mai mare divizor comun a doi 
termeni de rang oarecare din şirul lui Fibonacci. 


Indicaţie: Un algoritm eficient se obţine folosind următoarea proprietate”, 
valabilă pentru oricare doi termeni ai şirului lui Fibonacci: 


emmde( Sm Jn ) = J scandat n) 


O 1 
1.7 Fie matricea m =| 9 i Calculaţi produsul vectorului (f, p fp) cu 


matricea M ”, unde Fn-u ŞI f, sunt doi termeni consecutivi oarecare ai șirului lui 


Fibonacci. 


” Această surprinzătoare proprietate a fost descoperită în 1876 de Lucas. 


2. Programare 
orientată pe obiect 


Deși această carte este dedicată în primul rând analizei şi elaborării algoritmilor, 
am considerat util să folosim numeroşii algoritmi care sunt studiaţi ca un pretext 
pentru introducerea elementelor de bază ale programării orientate pe obiect în 
limbajul C++. Vom prezenta în capitolul de față noţiuni fundamentale legate de 
obiecte, limbajul C++ şi de abstractizarea datelor în C++, urmând ca, pe baza 
unor exemple detaliate, să conturăm în capitolele următoare din ce în ce mai clar 
tehnica programării orientate pe obiect. Scopul urmărit este de a surprinde acele 
aspecte strict necesare formării unei impresii juste asupra programării orientate pe 
obiect în limbajul C++, şi nu de a substitui cartea de față unui curs complet de 
C++. 


2.1 Conceptul de obiect 


Activitatea de programare a calculatoarelor a apărut la sfârşitul anilor ‘40. 
Primele programe au fost scrise în limbaj maşină şi de aceea depindeau în 
întregime de arhitectura calculatorului pentru care erau concepute. Tehnicile de 
programare au evoluat apoi în mod natural spre o tot mai netă separare între 
conceptele manipulate de programe şi reprezentările acestor concepte în 
calculator. 


În faţa complexităţii crescânde a problemelor care se cereau soluționate, 
structurarea programelor a devenit indispensabilă. Şcoala de programare Algol a 
propus la începutul anilor *60 o abordare devenită între timp clasică. Conform 
celebrei ecuaţii a lui Niklaus Wirth: 


algoritmi + structuri de date = programe 


un program este format din două părți total separate: un ansamblu de proceduri și 
un ansamblu de date asupra cărora acţionează procedurile. Procedurile sunt privite 
ca şi cutii negre, fiecare având de rezolvat o anumită sarcină (de făcut anumite 
prelucrări). Această modalitate de programare se numeşte programare dirijată de 
prelucrări. Evoluţia calculatoarelor şi a problemelor de programare a făcut ca în 
aproximativ zece ani programarea dirijată de prelucrări să devină ineficientă. 
Astfel, chiar dacă un limbaj ca Pascal-ul permite o bună structurare a programului 
în proceduri, este posibil ca o schimbare relativ minoră în structura datelor să 
provoace o dezorganizare majoră a procedurilor. 


14 


Secţiunea 2.1 Conceptul de obiect 15 


Inconvenientele programării dirijate de prelucrări sunt eliminate prin 
încapsularea datelor şi a procedurilor care le manipulează într-o singură entitate 
numită obiect. Lumea exterioară obiectului are acces la datele sau procedurile lui 
doar prin intermediul unor operaţii care constituie interfața obiectului. 
Programatorul nu este obligat să cunoască reprezentarea fizică a datelor și 
procedurilor utilizate, motiv pentru care poate trata obiectul ca pe o cutie neagră 
cu un comportament bine precizat. Această caracteristică permite realizarea unor 
tipuri abstracte de date. Este vorba de obiecte înzestrate cu o interfață prin care 
se specifică interacţiunile cu exteriorul, singura modalitate de a comunica cu un 
astfel de obiect fiind invocarea interfeţei sale. În terminologia specifică 
programării orientate pe obiect, procedurile care formează interfaţa unui obiect se 
numesc metode. Obiectul este singurul responsabil de maniera în care se 
efectuează operaţiile asupra lui. Apelul unei metode este doar o cerere, un mesaj 
al apelantului care solicită executarea unei anumite acţiuni. Obiectul poate refuza 
să o execute, sau, la fel de bine, o poate transmite unui alt obiect. În acest 
context, programarea devine dirijată de date, şi nu de prelucrările care trebuie 
realizate. 


Utilizarea consecventă a obiectelor conferă programării următoarele calități: 


e Abstractizarea datelor. Nu este nevoie de a cunoaşte implementarea şi 
reprezentarea internă a unui obiect pentru a-i adresa mesaje. Obiectul decide 
singur maniera de execuţie a operaţiei cerute în functie de implementarea 
fizică. Este posibilă supraîncărcarea metodelor, în sensul că la aceleaşi mesaje, 
obiecte diferite răspund în mod diferit. De exemplu, este foarte comod de a 
desemna printr-un simbol unic, +, adunarea întregilor, concatenarea şirurilor 
de caractere, reuniunea mulțimilor etc. 


e Modularitate. Structura programului este determinată în mare măsură de 
obiectele utilizate. Schimbarea definiţiilor unor obiecte se poate face cu un 
minim de implicaţii asupra celorlalte obiecte utilizate în program. 


e Flexibilitate. Un obiect este definit prin comportamentul său grație existenţei 
unei interfeţe explicite. El poate fi foarte uşor introdus într-o bibliotecă pentru 
a fi utilizat ca atare, sau pentru a construi noi tipuri prin moştenire, adică prin 
specializare şi compunere cu obiecte existente. 


e Claritate. Încapsularea, posibilitatea de supraîncărcare și modularitatea 
întăresc claritatea programelor. Detaliile de implementare sunt izolate de 
lumea exterioară, numele metodelor pot fi alese cât mai natural posibil, iar 
interfețele specifică precis şi detaliat modul de utilizare al obiectului. 


2.2 Limbajul C++ 


Toate limbajele de nivel înalt, de la FORTRAN la LISP, permit adaptarea unui stil 
de programare orientat pe obiect, dar numai câteva oferă mecanismele pentru 
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utilizarea directă a obiectelor. Din acest punct de vedere, menționăm două mari 
categorii de limbaje: 


e Limbaje care oferă doar facilități de abstractizarea datelor şi încapsulare, cum 
sunt Ada şi Modula-2. De exemplu, în Ada, datele şi procedurile care le 
manipulează pot fi grupate într-un pachet (package). 


e Limbaje orientate pe obiect, care adaugă abstractizării datelor noţiunea de 
moştenire. 


Deși definițiile de mai sus restrâng mult mulțimea limbajelor calificabile ca 
“orientate pe obiect”, aceste limbaje rămân totuşi foarte diverse, atât din punct de 
vedere al conceptelor folosite, cât şi datorită modului de implementare. S-au 
conturat trei mari familii, fiecare accentuând un anumit aspect al noţiunii de 
obiect: limbaje de clase, limbaje de cadre (frames) şi limbaje de tip actor. 


Limbajul C++" aparţine familiei limbajelor de clase. O clasă este un tip de date 
care descrie un ansamblu de obiecte cu aceeași structură şi acelaşi comportament. 
Clasele pot fi îmbogăţite și completate pentru a defini alte familii de obiecte. În 
acest mod se obţin ierarhii de clase din ce în ce mai specializate, care moștenesc 
datele şi metodele claselor din care au fost create. Din punct de vedere istoric 
primele limbaje de clase au fost Simula (1973) şi Smalltalk-80 (1983). Limbajul 
Simula a servit ca model pentru o întregă linie de limbaje caracterizate printr-o 
organizare statică a tipurilor de date. 


Să vedem acum care sunt principalele deosebiri dintre limbajele C şi C++, precum 
şi modul în care s-au implementat intrările/ieşirile în limbajul C++. 


2.2.1 Diferenţele dintre limbajele C şi C+ 


Limbajul C, foarte lejer în privința verificării tipurilor de date, lasă 
programatorului o libertate deplină. Această libertate este o sursă permanentă de 
erori şi de efecte colaterale foarte dificil de depanat. Limbajul C++ a introdus o 
verificare foarte strictă a tipurilor de date. În particular, apelul oricarei funcții 
trebuie precedat de declararea funcţiei respective. Pe baza declaraţiilor, prin care 
se specifică numărul şi tipul parametrilor formali, parametrii efectivi poat fi 
verificaţi în momentul compilării apelului. În cazul unor nepotriviri de tipuri, 
compilatorul încearcă realizarea corespondenţei (matching) prin invocarea unor 
conversii, semnalând eroare doar dacă nu găsește nici o posibilitate. 


float maxim( float, float ); 
float x = maximi( 3, 2.5 ); 


” Limbaj dezvoltat de Bjarne Stroustrup la începutul anilor ‘80, în cadrul laboratoarelor Bell de la 
AT&T, ca o extindere orientată pe obiect a limbajului C. 
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În acest exemplu, funcţia maxim () este declarată ca o funcţie de tip float cu doi 
parametri tot de tip float, motiv pentru care constanta întreagă 3 este convertită 
în momentul apelului la tipul float. Declaraţia unei funcţii constă în prototipul 
funcţiei, care conţine tipul valorii returnate, numele funcției, numărul şi tipul 
parametrilor. Diferenţa dintre definiție şi declarație — noţiuni valabile şi pentru 
variabile — constă în faptul că definiția este o declarație care provoacă şi 
rezervare de spaţiu sau generare de cod. Declararea unei variabile se face prin 
precedarea obligatorie a definiției de cuvântul cheie extern. Şi o declaraţie de 
funcţie poate fi precedată de cuvântul cheie extern, accentuând astfel că funcţia 
este definită altundeva. 


Definirea unor funcţii foarte mici, pentru care procedura de apel tinde să dureze 
mai mult decât executarea propriu-zisă, se realizează în limbajul C++ prin 
funcţiile inline. 


inline float maximt float x; float y ) | 
putehari "E! J} ceturni X > y? xi yj 


} 


Specificarea inline este doar orientativă şi indică compilatorului că este 
preferabil de a înlocui fiecare apel cu corpul funcției apelate. Expandarea unei 
funcții inline nu este o simplă substituție de text în progamul sursă, deoarece se 
realizează prin păstrarea semanticii apelului, deci inclusiv a verificării 
corespondenței tipurilor parametrilor efectivi. 


Mecanismul de verificare a tipului lucrează într-un mod foarte flexibil, permițând 
atât existența funcțiilor cu un număr variabil de argumente, cât şi a celor 
supraîncărcate. Supraîncărcarea permite existența mai multor funcții cu acelaşi 
nume, dar cu paremetri diferiți. Eliminarea ambiguității care apare în momentul 
apelului se rezolvă pe baza numărului şi tipului parametrilor efectivi. Iată, de 
exemplu, o altă funcție maxim (): 


inline int maxim( int x, int y) { 
putehat i "ai! Jy return x > y? x: vi 


) 


(Prin apelarea funcţiei putchar (), putem afla care din cele două funcții maxim () 
este efectiv invocată). 


În limbajul C++ nu este obligatorie definirea variabilelor locale strict la începutul 
blocului de instrucțiuni. În exemplul de mai jos, tabloul buf şi întregul i pot fi 
utilizate din momentul definirii şi până la sfârşitul blocului în care au fost 
definite. 
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+define DIM 5 


void Ci > 4 
int buf[ DIM |]; 


for | int i = Qè îi < DIM; ) 

buf[ i++ ] = maxim( i, DIM - i); 
while ( ==i ) 

printi ( "539 Ty buf| 1 |] }; 


În legătură cu acest exemplu, să mai notăm și faptul că instrucţiunea for permite 
chiar definirea unor variabile (variabila i în cazul nostru). Variabilele definite în 
instrucțiunea for pot fi utilizate la nivelul blocului acestei instrucțiuni şi după 
terminarea executării ei. 


Deşi transmiterea parametrilor în limbajul C se face numai prin valoare, limbajul 
C++ autorizează în egală măsură şi transmiterea prin referință. Referințele, 
indicate prin caracterul &, permit accesarea în scriere a parametrilor efectivi, fără 
transmiterea lor prin adrese. lată un exemplu în care o procedură interschimbă 
(swap) valorile argumentelor. 


void swap( floate a, floats b ) | 
float tmp a; a b; p tmp; 
) 


Referințele evită duplicarea provocată de transmiterea parametrilor prin valoare şi 
sunt utile mai ales în cazul transmiterii unor structuri. De exemplu, presupunând 
existența unei structuri de tip struct punct, 


struct Punct. { 

float xi /* coordonatele unui */ 
float y; /* punct din plan */ 
); 


următoarea funcţie transformă un punct în simetricul lui faţă de cea de a doua 
bisectoare. 


void sim2( struct puncte p) { 
swap( p.x, p.y ); // p.x si p.y se transmit prin 
// referinta si nu prin valoare 
pP.X = -P.X; P.y = -Pp.yi 
) 


Parametrii de tip referință pot fi protejați de modificări accidentale prin 
declararea lor const. 
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void print( const struct puncte p) { 
// compilatorul interzice orice tentativa 
// de a modifica variabila p 
printf( "(54.1£, 54.18) n, p.x, p.y ); 

) 


Caracterele // indică faptul că restul liniei curente este un comentariu. Pe lângă 
această modalitate nouă de a introduce comentarii, limbajul C++ a preluat din 
limbajul C şi posibiliatea încadrării lor între /* şi */. 


Atributul const poate fi asociat nu numai parametrilor formali, ci şi unor definiții 
de variabile, a căror valoare este specificată în momentul compilării. Aceste 
variabile sunt variabile read-only (constante), deoarece nu mai pot fi modificate 
ulterior. În limbajul C, constantele pot fi definite doar prin intermediul directivei 
define, care este o sursă foarte puternică de erori. Astfel, în exemplul de mai 
Jos, constanta întreagă dim este o variabilă propriu-zisă accesibilă doar în funcţia 
g(). Dacă ar fi fost definită prin tdefine (vezi simbolul DIM utilizat în funcţia 
f () de mai sus) atunci orice identificator dim, care apare după directiva de 
definire şi până la sfârşitul fişierului sursă, este înlocuit cu valoarea respectivă, 
fără nici un fel de verificări sintactice. 


void g( ) { 
const int dim = 55 
struct punct buff dim ]ș 


for ( int 1 = 0; 1 < dim itt ) 4 
pufi i 1x = iy 
pufi i ]-y = dim / 2. = i} 


sima puffi i |] 
printi puff i ] 


i 
i 
Pentru a obţine un prim program în C++, nu avem decât să adăugăm obişnuitul 


include <stdio.h> 


precum şi funcția main () 


int main( ) 4 
puts( "n main," ); 


pute "in E )" 
puts ( "in g ( J“ 
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puts{ Tin === J4 
return 0; 


} 


Rezultatele obținute în urma rulării acestui program: 


suprind prin faptul că funcția float maxim( float, float ) este invocată 
înaintea funcției main (). Acest lucru este normal, deoarece variabila x trebuie 
inițializată înaintea lansării în execuție a funcției main (). 


2.2.2 Intrări/ieşiri în limbajul C++ 


Limbajul C++ permite definirea tipurilor abstracte de date prin intermediul 
claselor. Clasele nu sunt altceva decât generalizări ale structurilor din limbajul C. 
Ele conțin date membre, adică variabile de tipuri predefinite sau definite de 
utilizator prin intermediul altor clase, precum şi funcții membre, reprezentând 
metodele clasei. 


Cele mai utilizate clase C++ sunt cele prin care se realizează intrările şi ieşirile. 
Reamintim că în limbajul C, intrările şi ieșirile se fac prin intermediul unor funcţii 
de bibliotecă cum sunt scanf() şi printf(), funcţii care permit citirea sau 
scrierea numai a datelor (variabilelor) de tipuri predefinite (char, int, float 
etc.). Biblioteca standard asociată oricărui compilator C++, conţine ca suport 
pentru operaţiile de intrare şi ieşire nu simple funcţii, ci un set de clase adaptabile 
chiar şi unor tipuri noi, definite de utilizator. Această bibliotecă este un exemplu 
tipic pentru avantajele oferite de programarea orientată pe obiect. Pentru fixarea 
ideilor, vom folosi un program care determină termenul de rang n al şirului lui 
Fibonacci prin algoritmul fib2 din Secţiunea 1.6.4. 
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tinclude <iostream.h> 


long fib2( int n) 4 
long i = 1, 3=0; 


tor {int k= De kit < n7 J= a + Jy d == iy? 
return j; 


) 


int main( ) { 
cout << "nTermenul sirului lui Fibonacci de rang ... "; 
int ñ; 


cim >> riy 


cout << T este T << fibZ{ n J}; 
gout <a Pale 


return 0; 


Biblioteca standard C++ conține definițiile unor clase care reprezintă diferite 
tipuri de fluxuri de comunicație (stream-uri). Fiecare flux poate fi de intrare, de 
ieșire, sau de intrare/ieşire. Operația primară pentru fluxul de ieşire este 
inserarea de date, iar pentru cel de ieşire este extragerea de date. Fişierul prefix 
(header) iostream.h conţine declaraţiile fluxului de intrare (clasa istream), ale 
fluxului de ieşire (clasa ostream), precum şi declaraţiile obiectelor cin şi cout: 


extern istream cin; 
extern ostream cout; 


Operaţiile de inserare şi extragere sunt realizate prin funcţiile membre ale claselor 
ostream şi istream. Deoarece limbajul C++ permite existenţa unor funcții care 
supraîncarcă o parte din operatorii predefiniti, s-a convenit ca inserarea să se facă 
prin supraîncarcarea operatorului de decalare la stânga <<, iar extragerea prin 
supraîncărcarea celui de decalare la dreapta >>. Semnificaţia secvenței de 
instrucțiuni 


cin >> ny 
cout << T esta T << fib2{ n Jj 


este deci următoarea: se citeşte valoarea lui n, apoi se afişează şirul " este " 
urmat de valoarea returnată de funcția fib2 (). 


Fluxurile de comunicaţie cin şi cout lucrează în mod implicit cu terminalul 
utilizatorului. Ca şi pentru programele scrise în C, este posibilă redirectarea lor 
spre alte dispozitive sau în diferite fişiere, în funcție de dorinţa utilizatorului. 
Pentru sistemele de operare UNIX şi DOS, redirectările se indică adăugând 
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comenzii de lansare în execuţie a programului, argumente de forma >nume-— 
fisier-iesire, sau <nume-fisier-intrare. În iostream.h mai este definit 
încă un flux de ieşire numit cerr, utilizabil pentru semnalarea unor condiţii de 
excepţie. Fluxul cerr este legat de terminalul utilizatorului şi nu poate fi 
redirectat. 


Operatorii de inserare (<<) şi extragere (>>) sunt, la rândul lor, supraîncărcaţi 
astfel încât operandul drept să poată fi de orice tip predefinit. De exemplu, în 
instrucțiunea 


cout << T este T << fib2( n )ș 


se va apela operatorul de inserare cu argumentul drept de tip char*. Acest 
operator, ca şi toți operatorii de inserare şi extragere, returnează operandul stâng, 
adică stream-ul. Astfel, invocarea a doua oară a operatorului de inserare are 
sens, de acesată dată alegându-se cel cu argumentul drept de tip long. În prezent, 
biblioteca standard de intrare/ieșire are în jur de 4000 de linii de cod, şi conţine 
15 alternative pentru fiecare din operatorii << şi >>. Programatorul poate 
supraîncărca în continuare aceşti operatori pentru propriile tipuri. 


2.3 Clase în limbajul C++ 


Rulând programul pentru determinarea termenilor din şirul lui Fibonacci cu valori 
din ce în ce mai mari ale lui n, se observă că rezultatele nu mai pot fi reprezentate 
într-un int, long sau unsigned long. Soluţia care se impune este de a limita 
rangul n la valori rezonabile reprezentării alese. Cu alte cuvinte, n nu mai este de 
tip int, ci de un tip care limitează valorile întregi la un anumit interval. Vom 
elabora o clasă corespunzătoare acestui tip de întregi, clasă utilă multor programe 
în care se cere menţinerea unei valori între anumite limite. 


Clasa se numeşte intErval, şi va fi implementată în două variante. Prima variantă 
este realizată în limbajul C. Nu este o clasă propriu-zisă, ci o structură care 
confirmă faptul că orice limbaj permite adaptarea unui stil de programare orientat 
pe obiect şi scoate în evidenţă inconvenientele generate de lipsa mecanismelor de 
manipulare a obiectelor. A doua variantă este scrisă în limbajul C++. Este un 
adevărat tip abstract ale cărui calități sunt și mai bine conturate prin comparația 
cu (pseudo) tipul elaborat în C. 
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2.3.1 Tipul intErval în limbajul C 


Reprezentarea internă a tipului conţine trei membri de tip întreg: marginile 
intervalului şi valoarea propriu-zisă. Le vom grupa într-o structură care, prin 
intermediul instrucţiunii typedef, devine sinonimă cu intărval. 


typedef struct | 
int min; /* marginea inferioara a intervalului */ 
int max; /* marginea superioara a intervalului */ 
ipt yi /* valoarea, min <= v, v < max + 
) intErval; 


Variabilele (obiectele) de tip intErval se definesc folosind sintaxa uzuală din 
limbajul C. 


intErval numar = ( 80, 32, 64]; 
intErval indice, limita; 


Efectul acestor definiţii constă în rezervarea de spaţiu pentru fiecare din datele 
membre ale obiectelor numar, indice şi limita. În plus, datele membre din 
numar sunt iniţializate cu valorile 80 (min), 32 (max) şi 64 (v). Iniţializarea, deşi 
corectă din punct de vedere sintactic, face imposiblă funcţionarea tipului 
intErval, deoarece marginea inferioară nu este mai mică decât cea superioară. 
Deocamdată nu avem nici un mecanism pentru a evita astfel de situații. 


Pentru manipularea obiectelor de tip intErval, putem folosi atribuiri la nivel de 
structură: 


limita = numar; 


Astfel de atribuiri se numesc arribuiri membru cu membru, deoarece sunt realizate 
între datele membre corespunzătoare celor două obiecte implicate în atribuire. 


O altă posibilitate este accesul direct la membri: 


indice.min = 32; indice.max = 64; 
indice.v = numar.v + 13 


Selectarea directă a membrilor încalcă proprietățile fundamentale ale obiectelor. 
Reamintim că un obiect este manipulat exclusiv prin interfața sa, structura lui 
internă fiind în general inaccesibilă. 


Comportamentul obiectelor este realizat printr-un set de metode implementate în 
limbajul C ca funcţii. Pentru intErval, acestea trebuie să permită în primul rând 
selectarea, atât în scriere cât şi în citire, a valorii propriu-zise date de membrul v. 
Funcţia de scriere atr () verifică încadrarea noii valori în domeniul admisibil, iar 
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funcţia de citire val () pur şi simplu returnează valoarea v. Practic, aceste două 
funcții implementează o formă de încapsulare, izolând reprezentarea internă a 
obiectului de restul programului. 


int acri intErval *pr; ine i j 4 
return pn->v = verDom( *pn, i); 

) 

int valt intErval n ) { 


return n.v; 


) 


Funcţia verDom () verifică încadrarea în domeniul admisibil: 


int verDom( intErval n, int i) { 
if (1i < n min |] i >= n.max ) { 
fputs( "\n\nintErval == valoare exterioara. nn", stderr); 


exit ( 1 j}; 
) 


return i; 


Utilizând consecvent cele două metode ale tipului intErval, obţinem obiecte ale 
căror valori sunt cu certitudine între limitele admisibile. De exemplu, utilizând 
metodele atr () şi val (), instrucţiunea 


indice.v = numar.v + 13 


devine 


atr( &indice, val( numar ) + 1 ); 


Deoarece numar are valoarea 64, iar domeniul indice-lui este 32, ..., 64, 
instrucţiunea de mai sus semnalează depăşirea domeniului variabilei indice şi 
provoacă terminarea executării programului. 


Această implementare este departe de a fi completă şi comod de utilizat. Nu ne 
referim acum la aspecte cum ar fi citirea (sau scrierea) obiectelor de tip 
intErval, operaţie rezolvabilă printr-o funcţie de genul 


void citi interval *pn ) | 
INE ii 
scan € "pad"; Bi Ye 
atr( pn, i); 


ci la altele, mult mai delicate, cum ar fi: 
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I, Evitarea unor iniţializări eronate din punct de vedere semantic şi interzicerea 
utilizării obiectelor neinițializate: 


intErval numar = (80,32,64); // obiect incorect initializat 
intErval indice, limita; // obiecte neinitializate 


IL, Interzicerea modificării necontrolate a datelor membre: 


indice.v = numar.v + 1; 


I; Sintaxa foarte încărcată, diferită de sintaxa obişnuită în manipularea tipurilor 
întregi predefinite. 


In concluzie, această implementare, în loc să ne simplifice activitatea de 
programare, mai mult a complicat-o. Cauza nu este însă conceperea greşită a 
tipului intErval, ci lipsa facilităților de manipulare a obiectelor din limbajul C. 


2.3.2 Tipul intErval în limbajul C++ 


Clasele se obţin prin completarea structurilor uzuale din limbajul C cu setul de 
funcţii necesar implementării interfeţei obiectului. În plus, pentru realizarea 
izolării reprezentării interne de restul programului, fiecărui membru i se asociază 
nivelul de încapsulare public sau private. Un membru public corespunde, din 
punct de vedere al nivelului de accesibilitate, membrilor structurilor din limbajul 
C. Membrii private sunt accesibili doar în domeniul clasei, adică în clasa 
propriu-zisă și în toate funcțiile membre. În clasa intErval, membrii publici sunt 
doar funcţiile atr () şi val (), iar membrii verDom(), min, max şi v sunt privaţi. 


class intEărval | 
publics 
int atr{ int )ș 
int vali ) { return vi } 


private: 
int verDom( int ); 


int min, max; 
int y; 


); 


Obiectele de tip intErval se definesc ca şi în limbajul C. 


26 Programare orientată pe obiect Capitolul 2 


intErval numar; 
intErval indice, limita; 


Aceste obiecte pot fi atribuite între ele (fiind structuri atribuirea se va face 
membru cu membru): 


limita = numar; 
şi pot fi inițializate (tot membru cu membru) cu un obiect de acelaşi tip: 
intErval cod = numar; 


Selectarea membrilor se face prin notaţiile utilizate pentru structuri. De exemplu, 
după executarea instrucţiunii 


indice.atr( numar.,val| ) + L )ș 


valoarea obiectului indice va fi valoarea obiectului numar, incrementată cu 1. 
Această operaţie poate fi descrisă şi prin intrucţiunea 


indice.v = numar.v + 1; 


care, deşi corectă din punct de vedere sintactic, este incorectă semantic, deoarece 
v este un membru private, deci inaccesibil prin intermediul obiectelor indice şi 
numar. 


După cum se observă, au dispărut argumentele de tip intErval* şi intErval ale 
funcțiilor atr (), respectiv val (). Cauza este faptul că funcțiile membre au un 
argument implicit, concretizat în obiectul invocator, adică obiectul care 
selectează funcţia. Este o convenţie care întăreşte şi mai mult atributul de funcţie 
membră (metodă) deoarece permite invocarea unei astfel de funcţii numai prin 
obiectul respectiv. 


Definirea funcțiilor membre se poate face fie în corpul clasei, fie în exteriorul 
acestuia. Funcţiile definite în corpul clasei sunt considerate implicit inline, iar 
pentru cele definite în exteriorul corpului se impune precizarea statutului de 
funcție membră. Înainte de a defini funcțiile atr () şi verDom(), să observăm că 
funcţia val (), definită în corpul clasei intErval, încalcă de două ori cele 
precizate până aici. În primul rând, nu selectează membrul v prin intermediul unui 
obiect, iar în al doilea rând, v este privat! Dacă funcţia val () ar fi fost o funcţie 
obişnuită, atunci observaţia ar fi fost cât se poate de corectă. Dar val() este 
funcţie membră şi atunci: 


e Nu poate fi apelată decât prin intermediul unui obiect invocator și toți membrii 
utilizați sunt membrii obiectului invocator. 
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e |Incapsularea unui membru funcţionează doar în exteriorul domeniului clasei. 
Funcţiile membre fac parte din acest domeniu şi au acces la toți membrii, 
indiferent de nivelul lor de încapsulare. 


Specificarea atributului de funcţie membră se face precedând numele funcției de 
operatorul domeniu :: şi de numele domeniului, care este chiar numele clasei. 
Pentru asigurarea consistenţei clasei, funcțiile membre definite în exterior trebuie 
obligatoriu declarate în corpul clasei. 


int intErval::verDom( int i) { 
if {i< min || i soma) 4 
cerr << "ininintErval ==- "<< i 
<< ": valoare exterioara domeniului [ " 
<2 min << T; T e< (maz = 1) «€< 9 Jynn"; 


eēexit( 1 j); 
) 


return i; 


) 


ant interval; iatrí int i ) { 
return v = verDom( i); 
// verDom(), fiind membru ca si v, se va invoca pentru 
/{ obiectul invocator al functiei atr() 


Din cele trei inconveniente menţionate în finalul Secţiunii 2.3.1 am rezolvat, până 
în acest moment, doar inconvenientul I», cel care se referă la încapsularea datelor. 
In continuare ne vom ocupa de I}, adică de simplificarea sintaxei. 


Limbajul C++ permite nu numai supraîncărcarea funcțiilor, ci şi a majorităţii 
operatorilor  predefiniți. In general, sunt posibile două modalități de 
supraîncărcare: 

e Ca funcții membre, caz în care operandul stâng este implicit obiect invocator. 


e Ca funcții nemembre, dar cu condiţia ca cel puţin un argument (operand) să fie 
de tip clasă. 


Pentru clasa intErval, ne interesează în primul rând operatorul de atribuire 
(implementat deocamdată prin funcţia atr ()) şi un operator care să corespundă 
funcţiei val (). Deşi pare surprinzător, funcţia val () nu face altceva decât să 
convertească tipul intErval la tipul int. În consecință, vom implementa această 
funcţie ca operator de conversie la int. În noua sa formă, clasa intErval arată 
astfel: 
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class intErval | 


public: 
// operatorul de atribuire corespunzator functiei atr () 
int operator =( int i ) { return v = verDom( i); } 


// operatorul de conversie corespunzator functiei val() 
operator int( ) { return v; } 


private: 
int verDom( int ); 


int min, max; 


int v} 


); 


Revenind la obiectele indice şi numar, putem scrie acum 


indice = (int)numar + 1; 
sau direct 
indice = numar + 1; 


conversia numar-ului la int fiind invocată automat de către compilator. Nu este 
nimic miraculos în această invocare “automată”, deoarece operatorul + nu este 
definit pentru argumente de tip intErval şi int, dar este definit pentru int şi 
int. Altfel spus, expresia numar + 1 poate fi evaluată printr-o simplă conversie a 
primului operand de la interval la int. 


O altă funcție utilă tipului intErval este cea de citire a valorii v, funcție 
denumită în paragraful precedent cit (). Ne propunem să o înlocuim cu 
operatorul de extragere >>, pentru a putea scrie direct cin >> numar. 
Supraîncărcarea operatorului >> ca funcţie membră nu este posibilă, deoarece 
argumentul stâng este obiectul invocator şi atunci ar trebui să scriem n >> cin. 


Operatorul de extragere necesar pentru citirea valorii obiectelor de tip intErval 
se poate defini astfel: 


istream& operator >>( istream& is, intErval& n ) | 
INe 2y 
if (is >> i) // se citeste valoarea 
n= i; // se invoca operatorul de atribuire 
return is; 


Sunt două întrebări la care trebuie să răspundem referitor la funcţia de mai sus: 


e Care este semnificaţia testului if ( is >> i 9)? 


e De ce se returnează istream-ul? 
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În testul if ( is >> i ) se invocă de fapt operatorul de conversie de la 
istream la int, rezultatul fiind valoarea logică true (valoare diferită de zero) sau 
false (valoarea zero), după cum operaţia a decurs normal sau nu. 


Returnarea istream-ului este o modalitate de a aplica operatorului >> sintaxa de 
concatenare, sintaxă utilizată în expresii de forma i = j = 0. De exemplu, 
obiectele numar şi indice de tip intErval, pot fi citite printr-o singură 
instrucțiune 


cin >> numar >> indice; 


De asemenea, remarcăm și utilizarea absolut justificată a argumentelor de tip 
referinţă. În lipsa lor, obiectul numar ar fi putut să fie modificat doar dacă i-am fi 
transmis adresa. În plus, utilizarea sintaxei de concatenare provoacă, în lipsa 
referințelor, multiplicarea argumentului de tip istream de două ori pentru fiecare 
apel: prima dată ca argument efectiv, iar a doua oară ca valoare returnată. 


Clasa intErval a devenit o clasă comod de utilizat, foarte bine încapsulată şi cu 
un comportament similar întregilor. Încapsularea este însă atât de bună, încât, 
practic, nu avem nici o modalitate de a iniţializa limitele superioară și inferioară 
ale domeniului admisibil. De fapt, am revenit la inconvenientul I; menţionat în 
finalul Secţiunii 2.3.1. Problema inițializării datelor membre în momentul 
definirii obiectelor nu este specifică doar clasei interval. Pentru rezolvarea ei, 
limbajul C++ oferă o categorie specială de funcții membre, numite constructori. 
Constructorii nu au tip, au numele identic cu numele clasei şi sunt invocaţi 
automat de către compilator, după rezervarea spaţiului pentru datele obiectului 
definit. 


Constructorul necesar clasei intărval are ca argumente limitele domeniului 
admisibil. Transmiterea lor se poate face implicit, prin notația 


intErval numar( 80, 32 ); 


sau explicit, prin specificarea constructorului 


intErval numar = intErval( 80, 32 ); 


Definiţia acestui constructor este 
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intEerval:t:intăerval ( int sup, int inf ) 4 


if {( inf >= sup) 4 
cerr << "IninintErval -= domeniu incorect specificat [| 
sa inf << T E eg {sup = 1) <4 E 1. ans 


exit( 1 ); 


min = v = inf; 


Datorită lipsei unui constructor fără argumente, compilatorul va interzice orice 
declarații în care nu se specifică domeniul. De exemplu, 


intErval indice; 


este o definiție incompletă, semnalată la compilare. Mai mult, definițiile incorecte 
semantic cum este 


interval limitat 32; 80 )ș 


sunt și ele detectate, dar nu de către compilator, ci de către constructor. Acesta, 
după cum se observă, verifică dacă limita inferioară a domeniului este mai mică 
decât cea superioară, semnalând corespunzător domeniile incorect specificate. 


În declaraţiile funcţiilor, limbajul C++ permite specificarea valorilor implicite ale 
argumentelor, valori utilizabile în situațiile în care nu se specifică toți parametrii 
efectivi. Această facilitate este utilă şi în cazul constructorului clasei interval. 
Prin declaraţia 


intErval ( int = 1, int = 0); 
definiţia 
intErval indice; 


nu va mai fi respinsă, ci va provoca invocarea constructorului cu argumentele 
implicite 1 şi 0. Corespondenţa dintre argumentele actuale şi cele formale se 
realizează poziţional, ceea ce înseamnă că primul argument este asociat limitei 
superioare, iar cel de-al doilea celei inferioare. Frecvent, limita inferioară are 
valoarea implicită zero. Deci la transmiterea argumentelor constructorului, ne 
putem limita doar la precizarea limitei superioare. 


Constructorul apelabil fără nici un argument se numeşte constructor implicit. 
Altfel spus, constructorul implicit este constructorul care, fie nu are argumente, 
fie are toate argumentele implicite. Limbajul C++ nu impune prezența unui 
constructor implicit în fiecare clasă, dar sunt anumite situaţii în care acest 
constructor este absolut necesar. 


Secţiunea 2.3 Clase în limbajul C+ 31 


După aceste ultime precizări, definiția clasei intErval este: 


class intEărval | 

public: 
intErval | int = 1, int = 0 ); 
“intEerval( ) 4 ) 


int operator =( int i ) { return v = verDom( i); ) 
operator int( ) { return v; ) 
private: 


int verDom( int ); 


int min, max; 
int y; 


); 


Se observă apariţia unei noi funcţii membre, numită -intărval (), al cărui corp 
este vid. Ea se numeşte destructor, nu are tip şi nici argumente, iar numele ei este 
obținut prin precedarea numelui clasei de caracterul ~. Rolul destructorului este 
opus celui al constructorului, în sensul că realizează operaţiile necesare 
distrugerii corecte a obiectului. Destructorul este invocat automat, înainte de a 
elibera spaţiul alocat datelor membre ale obiectului care încetează să mai existe. 
Un obiect încetează să mai existe în următoarele situaţii: 


e Obiectele definite într-o funcţie sau bloc de instrucţiuni (obiecte cu existență 
locală) încetează să mai existe la terminarea executării funcţiei sau blocului 
respectiv. 

e Obiectele definite global, în exteriorul oricărei funcţii, sau cele definite 
static (obiecte cu existență statică) încetează să mai existe la terminarea 
programului. 

e Obiectele alocate dinamic prin operatorul new (obiecte cu existență dinamică) 
încetează să mai existe la invocarea operatorului delete. 


Ca şi în cazul constructorilor, prezența destructorului într-o clasă este opţională, 
fiind lăsată la latitudinea proiectantului clasei. 


Pentru a putea fi inclusă în toate fişierele sursă în care este utilizată, definiția unei 
clase se introduce într-un fişier header (prefix). În scopul evitării includerii de 
mai multe ori a aceluiaşi fişier (includeri multiple), se recomandă ca fişierele 
header să aibă structura 
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+ifndef simbol 
+define simbol 


// continutul fisierului 


tendif 


unde simbol este un identificator unic în program. Dacă fişierul a fost deja inclus, 
atunci identificatorul simbol este deja definit, şi deci, toate liniile situate între 
+ifndef şi #endif vor fi ignorate. De exemplu, în fişierul intErval.h, care 
conţine definiția clasei intErval, identificatorul simbol ar putea fi 
___INTeRVAL,_ H. lată conţinutul acestui fişier: 


+ifndef ___INTeRVAL_H 
+define ___INTeRVAL_H 


tinclude <iostream.h> 


class intEărval | 

publice: 
intErval ( int = 1, int = 0); 
-intErval ( ) ( } 


int operator =( int i ) { return v = verDom( i); ) 
operator int( ) { return v; ) 
private: 


int verDom( int ); 

int min, Max: 

int yi 
); 
istream& operator >>( istream&, intErval& ); 
tendi f 


Funcţiile membre se introduc într-un fişier sursă obişnuit, care este legat după 
compilare de programul executabil. Pentru clasa intErval, acest fişier este: 


+include "intErval.h" 
tinclude <stdlib.h> 


iñtErval::intErval( int sup, int int ) { 
if (inf >= sup) { 
cerr << "IninintErval -- domeniu incorect specificat [ " 
g Int <9 PN că {sup = 1) a4 a > 
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exit ( 1 j} 


) 
min = v = inf; 
max = sup; 


( 


int intEerval: :verDomi int i ) 
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if { i < min |] i >= máx >) { 
cerr << "ninintErval == " 
<< i << ": valoare exterioara domeniului [ " 
< min << Ti T << (maz = 1} << © |N > 
exit( 1 ); 
) 
return i; 
) 
istream& operator >>( istream& is, intErval& n ) { 
int i}; 
if (is >> i) // se citeste valoarea 


n = i; // se invoca 


return is; 


operatorul de atribuire 


Adaptarea programului pentru determinarea termenilor şirului lui Fibonacci 


Erval.h, precum şi schimbarea definiţiei 


necesită doar includerea fişierului int! 
rangului n din int în intErval. 


tinclude <iostream.h> 
+include "intărval.h" 


long fib2 [ 
long i 


{ 
= 0; 


Ine nmn} 
l J 


for | int K 
return J; 


} 


r 


int main 


cout << "nTermenul sirului lui Fibonacci de rang 


= A 


interval n = 477 gin Fă ns 
Cout <4 T este T << fib2( n )7 
cout <4 typis 


return 0; 


Desigur că, la programul executabil, 


compilării definiţiilor funcţiilor membre din clasa int! 


se va lega şi fişierul rezultat în urma 
Erval. 
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Neconcordanţa dintre argumentul formal de tip int din fib2() şi argumentul 
efectiv (actual) de tip intErval se rezolvă, de către compilator, prin invocarea 
operatorului de conversie de la intErval la int. 


Programarea orientată pe obiect este deosebit de avantajoasă în cazul aplicaţiilor 
mari, dezvoltate de echipe întregi de programatori pe parcursul câtorva luni, sau 
chiar ani. Aplicația prezentată aici este mult prea mică pentru a putea fi folosită 
ca un argument în favoarea acestei tehnici de programare. Cu toate acestea, 
comparând cele două implementări ale clasei intErval (în limbajele C, respectiv 


C++), sunt deja evidente două avantaje ale programării orientate pe obiect: 


e În primul rând, este posibilitatea dezvoltării unor tipuri noi, definite exclusiv 
prin comportament şi nu prin structură. Codul sursă este mai compact, dar în 
nici un caz mai rapid decât în situaţia în care nu am fi folosit obiecte. Să 
reținem că programarea orientată pe obiect nu este o modalitate de a micşora 
timpul de execuţie, ci de a spori eficienţa activităţii de programare. 

e În al doilea rând, se remarcă posibilităţile de a supraîncărca operatori, inclusiv 
pe cei de conversie. Efectul este foarte spectaculos, deoarece utilizarea noilor 
tipuri este la fel de comodă ca şi utilizarea tipurilor predefinite. Pentru tipul 
intErval, aceste avantaje se concretizează în faptul că obiectele de tip 
intErval se comportă exact ca şi cele de tip int, încadrarea lor în limitele 
domeniului admisibil fiind absolut garantată. 
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2.1 Scrieţi un program care determină termenul de rang n al şirului lui 
Fibonacci prin algoritmii fibl şi fib3. 


2.2 Care sunt valorile maxime ale lui n pentru care algoritmii fibl, fib2 şi fib3 
returnează valori corecte? Cum pot fi mărite aceste valori? 


Soluţie: Presupunând că un long este reprezentat pe 4 octeți, atunci cel mai mare 
număr Fibonacci reprezentabil pe long este cel cu rangul 46. Lucrând pe 
unsigned long, se poate ajunge până la termenul de rang 47. Pentru aceste 
ranguri, timpii de execuţie ai algoritmului fibl diferă semnificativ de cei ai 
algoritmilor fib2 şi fib3. 


2.3 Introduceţi în clasa interval încă două date membre prin care să 
contorizați numărul de apeluri ale celor doi operatori definiți. Completaţi 


” Chiar dacă nu se precizează explicit, toate implementările se vor realiza în limbajul C++. 
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constructorul şi destructorul astfel încât să inițializeze, respectiv să afişeze, aceste 
valori. 


2.4 Implementați testul de primalitate al lui Wilson prezentat în Secţiunea 
1.4. 
2.5 Scrieţi un program pentru calculul recursiv al coeficienţilor binomiali 


după formula dată de triunghiul lui Pascal: 


n-—l n-—l 
| + pentru 0< k< n 
*)- k-1 k 


k 1 altfel 


Analizaţi avantajele şi dezavantajele acestui program în raport cu programul care 
calculează coeficientul conform definiției: 


w _ n! 
m) mi(n —m)! 


Soluţie: Utilizarea definiţiei pentru calculul combinărilor este o idee total 
neinspirată, nu numai în ceea ce privește eficienţa, ci şi pentru faptul că nu poate 
fi aplicată decât pentru valori foarte mici ale lui n. De exemplu, într-un long de 4 
octeți, valoarea 13! nu mai poate fi calculată. Funcţia recursivă este simplă: 


inte C{ i0 ip inë m) 4 
return m == 0 || 
m == n? le Ctr 1, d 13) + Clan =l mja 


dar şi ineficientă, deoarece numărul apelurilor recursive este foarte mare (vezi 
Exerciţiul 8.1). Programul complet este: 


tinclude <iostream.h> 

const int. N = 16, M = 117; 

int r[N] [M];  // contorizeaza numarul de apeluri ale 
Fi functiei C( int, int ) separat, 


fd pentru toate valorile argumentelor 


long tE} // numarul total de apeluri ale 
fa functiei Cl Inte Ine ) 
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ant Ci int ny int m) 4 
e În] [m] tt; tre+re 


return m == |] m == n? 
lg Ci n Li i = 
) 


void main( ) { 
int ñp m; 
for (n = 0; n < N; n+ ) 


for (m 0; m < M; mtt ) [n] [m] = 0; 
Er- = O7 
cout << T\nCombinari de (maxim n <4 N <4 "J apa 13 
cin >> my 
Gout <a T luate cate ... "; 
cin >> my 
cout <44 Oi T s< CA ny m J) 8< Tint 


cout << Timne int; int ) a fost invocata de " 
<e ti «4 t ori astfel: im 
for { inte d = ls 1 <= nig itp cout ce TnT ĵ 
for | int J = Oy J <= iz ti ) { 
cout:width( 4 ); 
cout <4 elip] << 7 T3 


} 


Rezultatele obținute în urma rulării sunt următoarele: 


Combinari de (maxim 16) ...12 
luate cate ...7 
sunt 792 
CA int, int >) a fost invocata de 1583 ori astfel: 
210 210 


84 210 126 
28 84 126 70 


7 28 56 PO 35 

1 7 21 25 35 15 

9) an 6 15 20 15 5 

9) o AS 5 10 10 5 1 

9) 9) 9) Al 4 6 4 1 9) 

(8) 9) 9) 9) 1 3 3 1 9) 9) 

9) 9) 9) 9) 9) 1 2 Ki 9) 9) 9) 

(8) 9) (0) 9) 9) 9) 1 1 9) 9) 9) 9) 
(0) 9) (0) 9) 6) 9) (0) 1 9) 9) 9) 


Se observă că C(1,1) a fost invocată de 210 ori, iar C(2,2) de 126 de ori! 


3. Structuri elementare 
de date 


Înainte de a elabora un algoritm, trebuie să ne gândim la modul în care 
reprezentăm datele. În acest capitol vom trece în revistă structurile fundamentale 
de date cu care vom opera. Presupunem în continuare că sunteţi deja familiarizați 
cu noțiunile de fişier, tablou, listă, graf, arbore şi ne vom concentra mai ales pe 
prezentarea unor concepte mai particulare: heap-uri şi structuri de mulțimi 
disjuncte. 


3.1 Liste 


O listă este o colecţie de elemente de informaţie (noduri) aranjate într-o anumită 
ordine. Lungimea unei liste este numărul de noduri din listă. Structura 
corespunzătoare de date trebuie să ne permită să determinăm eficient care este 
primul/ultimul nod în structură şi care este predecesorul/succesorul (dacă există) 
unui nod dat. lată cum arată cea mai simplă listă, lista liniară: 


capul | alpha Bä beta H gamma | delta os 
listei listei 


O listă circulară este o listă în care, după ultimul nod, urmează primul, deci 
fiecare nod are succesor și predecesor. 


Operații curente care se fac în liste sunt: inserarea unui nod, ştergerea 
(extragerea) unui nod, concatenarea unor liste, numărarea elementelor unei liste 
etc. Implementarea unei liste se poate face în principal în două moduri: 


e Implementarea secvenţială, în locaţii succesive de memorie, conform ordinii 
nodurilor în listă. Avantajele acestei tehnici sunt accesul rapid la 
predecesorul/succesorul unui nod şi găsirea rapidă a primului/ultimului nod. 
Dezavantajele sunt inserarea/ştergerea relativ complicată a unui nod şi faptul 
că, în general, nu se foloseşte întreaga memorie alocată listei. 


e Implementarea înlănţuită. În acest caz, fiecare nod conține două părţi: 
informaţia propriu-zisă şi adresa nodului succesor. Alocarea memoriei fiecărui 
nod se poate face în mod dinamic, în timpul rulării programului. Accesul la un 
nod necesită parcurgerea tuturor predecesorilor săi, ceea ce poate lua ceva mai 
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mult timp. Inserarea/ştergerea unui nod este în schimb foarte rapidă. Se pot 
folosi două adrese în loc de una, astfel încât un nod să conţină pe lângă adresa 
nodului succesor şi adresa nodului predecesor. Obţinem astfel o listă dublu 
înlănțuită, care poate fi traversată în ambele direcții. 


Listele implementate înlănţuit pot fi reprezentate cel mai simplu prin tablouri. În 
acest caz, adresele sunt de fapt indici de tablou. O alternativă este să folosim 
tablouri paralele: să memorăm informaţia fiecărui nod (valoarea) într-o locaţie 
VAL|i] a tabloului VAL[I .. n], iar adresa (indicele) nodului său succesor într-o 
locaţie LINK[i] a tabloului LINK[I .. n]. Indicele de tablou al locației primului 
nod este memorat în variabila head. Vom conveni ca, pentru cazul listei vide, să 
avem head = 0. Convenim de asemenea ca LINK|ultimul nod din listă] = 0. 
Atunci, VAL[head] va conţine informaţia primului nod al listei, LINK[head] 
adresa celui de-al doilea nod, VALI[LINK[head]] informaţia din al doilea nod, 
LINKILINK|head]] adresa celui de-al treilea nod etc. 


Acest mod de reprezentare este simplu dar, la o analiză mai atentă, apare o 
problemă esenţială: cea a gestionării locaţiilor libere. O soluţie elegantă este să 
reprezentăm locaţiile libere tot sub forma unei liste înlănţuite. Atunci, ştergerea 
unui nod din lista inițială implică inserarea sa în lista cu locaţii libere, iar 
inserarea unui nod în lista inițială implică ştergerea sa din lista cu locaţii libere. 
Aspectul cel mai interesant este că, pentru implementarea listei de locaţii libere, 
putem folosi aceleaşi tablouri. Avem nevoie de o altă variabilă, freehead, care va 
conţine indicele primei locații libere din VAL şi LINK. Folosim aceleaşi convenţii: 
dacă freehead = 0 înseamnă că nu mai avem locaţii libere, iar LINK[ultima locaţie 
liberă] = 0. 


Vom descrie în continuare două tipuri de liste particulare foarte des folosite. 


3.1.1 Stive 


O stivă (stack) este o listă liniară cu proprietatea că operaţiile de 
inserare/extragere a nodurilor se fac în/din coada listei. Dacă nodurile A, B, C, D 
sunt inserate într-o stivă în această ordine, atunci primul nod care poate fi extras 
este D. În mod echivalent, spunem că ultimul nod inserat va fi și primul șters. Din 
acest motiv, stivele se mai numesc şi liste LIFO (Last In First Out), sau liste 
pushdown. 


Cel mai natural mod de reprezentare pentru o stivă este implementarea secvenţială 
într-un tablou S[1 .. n], unde n este numărul maxim de noduri. Primul nod va fi 
memorat în S$[1], al doilea în S$[2], iar ultimul în S[top], unde top este o variabilă 
care conţine adresa (indicele) ultimului nod inserat. Iniţial, când stiva este vidă, 
avem top = Q. Iată algoritmii de inserare şi de ştergere (extragere) a unui nod: 
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function push(x, SII .. n]) 
{adaugă nodul x în stivă) 
if top > n then return “stivă plină” 
top < top+l 
S[top] — x 
return “succes” 


> 


function pop(S[1 .. n]) 
{şterge ultimul nod inserat din stivă şi îl returnează) 


if top < 0 then return “stivă vidă” 
x < Stop] 

top — top-1 

return x 


Cei doi algoritmi necesită timp constant, deci nu depind de mărimea stivei. 


Vom da un exemplu elementar de utilizare a unei stive. Dacă avem de calculat 
expresia aritmetică 


5*(((9+8)*(4*6))+7) 


putem folosi o stivă pentru a memora rezultatele intermediare. Intr-o scriere 
simplificată, iată cum se poate calcula expresia de mai sus: 


push(5); push(9); push(8); push(pop + pop); push(4); push(6); 

push(pop * pop); push(pop * pop); push(1); push(pop + pop); 

push(pop * pop); write (pop); 
Observăm că, pentru a efectua o operaţie aritmetică, trebuie ca operanzii să fie 
deja în stivă atunci când întâlnim operatorul. Orice expresie aritmetică poate fi 
transformată astfel încât să îndeplinească această condiţie. Prin această 
transformare se obţine binecunoscuta notație postfixată (sau poloneză inversă), 
care se bucură de o proprietate remarcabilă: nu sunt necesare paranteze pentru a 
indica ordinea operaţiilor. Pentru exemplul de mai sus, notația postfixată este: 


598 +46 x x 7 + 


3.1.2 Cozi 


O coadă (queue) este o listă liniară în care inserările se fac doar în capul listei, 
iar extragerile doar din coada listei. Cozile se numesc şi liste FIFO (First In First 
Out). 


O reprezentare secvenţială interesantă pentru o coadă se obţine prin utilizarea 
unui tablou C[0 .. n—1], pe care îl tratăm ca şi cum ar fi circular: după locaţia 
C[n—-1] urmează locaţia C[0]. Fie tail variabila care conţine indicele locației 
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predecesoare primei locaţii ocupate şi fie head variabila care conţine indicele 
locației ocupate ultima oară. Variabilele head şi tail au aceeaşi valoare atunci şi 
numai atunci când coada este vidă. Iniţial, avem head = tail = 0. Inserarea şi 
ştergerea (extragerea) unui nod necesită timp constant. 


function insert-queue(x, C[0 .. n—1]) 
{adaugă nodul x în capul cozii} 
head — (head+1) mod n 
if head = tail then return “coadă plină” 
C[head] — x 
return “succes” 


function delete-queue(C[0 .. n-1]) 
{şterge nodul din coada listei şi îl returnează) 
if head = tail then return “coadă vidă” 
tail — (tail+1) mod n 
x e Clrail] 
return x 


Este surprinzător faptul că testul de coadă vidă este acelaşi cu testul de coadă 
plină. Dacă am folosi toate cele n locaţii, atunci nu am putea distinge între situația 
de “coadă plină” şi cea de “coadă vidă”, deoarece în ambele situații am avea 
head = tail. În consecinţă, se folosesc efectiv numai n—1 locaţii din cele n ale 
tabloului C, deci se pot implementa astfel cozi cu cel mult n—1 noduri. 


3.2  Grafuri 


Un graf este o pereche G = <V, M>, unde V este o mulțime de vârfuri, iar 
Mc Vx V este o mulțime de muchii. O muchie de la vârful a la vârful b este 
notată cu perechea ordonată (a, b), dacă graful este orientat, şi cu mulțimea 
(a, b}, dacă graful este neorientat. În cele ce urmează vom presupune că vârfurile 
a şi b sunt diferite. Două vârfuri unite printr-o muchie se numesc adiacente. Un 
drum este o succesiune de muchii de forma 


(a, a»), (a, az), S i (CHEP a,) 
sau de forma 
ta az}, ta», az}, Eat ta a,) 


după cum graful este orientat sau neorientat. Lungimea drumului este egală cu 
numărul muchiilor care îl constituie. Un drum simplu este un drum în care nici un 
vârf nu se repetă. Un ciclu este un drum care este simplu, cu excepţia primului şi 
ultimului vârf, care coincid. Un graf aciclic este un graf fără cicluri. Un subgraf 
al lui G este un graf <V', M'>, unde V'c V, iar M' este formată din muchiile din M 
care unesc vârfuri din V’. Un graf parțial este un graf <V, M'>, unde M" c M. 


Secţiunea 3.2 Grafuri 41 


Un graf neorientat este conex, dacă între oricare două vârfuri există un drum. 
Pentru grafuri orientate, această noţiune este întărită: un graf orientat este tare 
conex, dacă între oricare două vârfuri i şi j există un drum de la i la j şi un drum 
de la j la i. 


În cazul unui graf neconex, se pune problema determinării componentelor sale 
conexe. O componentă conexă este un subgraf conex maximal, adică un subgraf 
conex în care nici un vârf din subgraf nu este unit cu unul din afară printr-o 
muchie a grafului inițial. Împărțirea unui graf G = <V, M> în componentele sale 
conexe determină o partiție a lui V şi una a lui M. 


Un arbore este un graf neorientat aciclic conex. Sau, echivalent, un arbore este un 
. PA . o e . A) ps . 

graf neorientat în care există exact un drum între oricare două vârfuri . Un graf 

parţial care este arbore se numeşte arbore parțial. 


Vârturilor unui graf li se pot ataşa informații numite uneori valori, iar muchiilor li 
se pot atașa informaţii numite uneori lungimi sau costuri. 


Există cel puţin trei moduri evidente de reprezentare ale unui graf: 


e Printr-o matrice de adiacenţă A, în care Ali, j] = true dacă vârfurile i şi j sunt 
adiacente, iar A[i, j] = false în caz contrar. O variantă alternativă este să-i dăm 
lui A[i,j] valoarea lungimii muchiei dintre vârfurile i şi j, considerând 
ALi, j] = +œ atunci când cele două vârfuri nu sunt adiacente. Memoria necesară 
este în ordinul lui n’. Cu această reprezentare, putem verifica uşor dacă două 
vârfuri sunt adiacente. Pe de altă parte, dacă dorim să aflăm toate vârfurile 
adiacente unui vârf dat, trebuie să analizăm o întreagă linie din matrice. 
Aceasta necesită n operaţii (unde n este numărul de vârfuri în graf), 
independent de numărul de muchii care conectează vârful respectiv. 


e Prin liste de adiacență, adică prin ataşarea la fiecare vârf i a listei de vârfuri 
adiacente lui (pentru grafuri orientate, este necesar ca muchia să plece din îi). 
Într-un graf cu m muchii, suma lungimilor listelor de adiacenţă este 2m, dacă 
graful este neorientat, respectiv m, dacă graful este orientat. Dacă numărul 
muchiilor în graf este mic, această reprezentare este preferabilă din punct de 
vedere al memoriei necesare. Este posibil să examinăm toţi vecinii unui vârf 
dat, în medie, în mai puţin de n operaţii. Pe de altă parte, pentru a determina 
dacă două vârfuri i și j sunt adiacente, trebuie să analizăm lista de adiacenţă a 
lui i (şi, posibil, lista de adiacenţă a lui j), ceea ce este mai puţin eficient decât 
consultarea unei valori logice în matricea de adiacenţă. 


e Printr-o listă de muchii. Această reprezentare este eficientă atunci când avem 
de examinat toate muchiile grafului. 


În Exerciţiul 3.2 sunt date şi alte propoziţii echivalente care caracterizează un arbore. 
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nivelul adâncimea 


2 0 
1 1 
0 2 


Figura 3.1 Un arbore cu rădăcină. 


3.3 Arbori cu rădăcină 


Fie G un graf orientat. G este un arbore cu rădăcina r, dacă există în G un vârf r 
din care oricare alt vârf poate fi ajuns printr-un drum unic. 


Definiţia este valabilă și pentru cazul unui graf neorientat, alegerea unei rădăcini 
fiind însă în acest caz arbitrară: orice arbore este un arbore cu rădăcină, iar 
rădăcina poate fi fixată în oricare vârf al său. Aceasta, deoarece dintr-un vârf 
oarecare se poate ajunge în oricare alt vârf printr-un drum unic. 


Când nu va fi pericol de confuzie, vom folosi termenul “arbore”, în loc de 
termenul corect “arbore cu rădăcină”. Cel mai intuitiv este să reprezentăm un 
arbore cu rădăcină, ca pe un arbore propriu-zis. În Figura 3.1, vom spune că beta 
este tatăl lui delta şi fiul lui alpha, că beta şi gamma sunt frați, că delta este un 
descendent al lui alpha, iar alpha este un ascendent al lui delta. Un vârt terminal 
este un vârf fără descendenţi. Vârfurile care nu sunt terminale sunt neterminale. 
De multe ori, vom considera că există o ordonare a descendenților aceluiaşi 
părinte: beta este situat la stânga lui gamma, adică beta este fratele mai vârstnic 
al lui gamma. 


Orice vârf al unui arbore cu rădăcină este rădăcina unui subarbore constând din 
vârful respectiv şi toți descendenții săi. O mulțime de arbori disjuncți formează o 
pădure. 

Intr-un arbore cu rădăcină vom adopta următoarele notații. Adâncimea unui vârf 


este lungimea drumului dintre rădăcină şi acest vârf; înălțimea unui vârf este 
lungimea celui mai lung drum dintre acest vârf şi un vârf terminal; înălțimea 
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iat ea îi d dă e at aaa d et ae valoarea vârfului 
| Pe Să adresa fiului stâng 
a adresa fiului drept 
l o 
a 
b 
y y 


Figura 3.2 Reprezentarea prin adrese a unui arbore binar. 


arborelui este înălțimea rădăcinii; nivelul unui vârf este înălțimea arborelui, 
minus adâncimea acestui vârf. 


Reprezentarea unui arbore cu rădăcină se poate face prin adrese, ca şi în cazul 
listelor înlănțuite. Fiecare vârf va fi memorat în trei locații diferite, reprezentând 
informația propriu-zisă a vârfului (valoarea vârfului), adresa celui mai vârstnic fiu 
şi adresa următorului frate. Păstrând analogia cu listele înlănțuite, dacă se 
cunoaşte de la început numărul maxim de vârfuri, atunci implementarea arborilor 
cu rădăcină se poate face prin tablouri paralele. 


Dacă fiecare vârf al unui arbore cu rădăcină are până la n fii, arborele respectiv 
este n-ar. Un arbore binar poate fi reprezentat prin adrese, ca în Figura 3.2. 
Observăm că pozițiile pe care le ocupă cei doi fii ai unui vârf sunt semnificative: 
lui a îi lipseşte fiul drept, iar b este fiul stâng al lui a. 


2 A 2 Í A ; T. k 

Intr-un arbore binar, numărul maxim de vârfuri de adâncime k este 2°. Un arbore 
: A 14: P i+1 A pot - i+1 A : 
binar de înălțime i are cel mult 2'* —1 vârfuri, iar dacă are exact 2'*—1 vârfuri, se 
numeşte arbore plin. Vârfurile unui arbore plin se numerotează în ordinea 
adâncimii. Pentru aceeaşi adâncime, numerotarea se face în arbore de la stânga la 


dreapta (Figura 3.3). 


Un arbore binar cu n vârfuri şi de înălțime i este complet, dacă se obţine din 
arborele binar plin de înălțime i, prin eliminarea, dacă este cazul, a vârfurilor 
numerotate cu n+l, n+2, sa sii aia Acest tip de arbore se poate reprezenta 
secvențial folosind un tablou T, punând vârfurile de adâncime k, de la stânga la 
dreapta, în poziţiile T[2*], T[2*], "e T[2*"!-1] (cu posibila excepție a nivelului 
0, care poate fi incomplet). De exemplu, Figura 3.4 exemplifică cum poate fi 
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9 “a Pa [9] 


Figura 3.3 Numerotarea vârfurilor într-un arbore binar de înălţime 3. 


reprezentat un arbore binar complet cu zece vârfuri, obţinut din arborele plin din 
Figura 3.3, prin eliminarea vârfurilor 11, 12, 13, 14 şi 15. Tatăl unui vârf 
reprezentat în T[i], i > 1, se află în T[i div 2]. Fiii unui vârf reprezentat în T[i] se 
află, dacă există, în T[2i] şi T[2i+1]. 


Facem acum o scurtă incursiune în matematica elementară, pentru a stabili câteva 
rezultate de care vom avea nevoie în capitolele următoare. Pentru un număr real 
oarecare x, definim 


Lx] = max(n | n <x, n este întreg} şi [x]= min(n | n 2x, n este întreg} 


Puteți demonstra cu ușurință următoarele proprietăți: 


TU] 
T [2] T [3] 
4 ai A X i E A 
T [4] T[5] T[6] T [7] 
Z N Pa 
x A N 
T [8] T[9] T[10] 


Figura 3.4 Un arbore binar complet. 
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i)  x-—l <lx]<x<[x]< x+ 
pentru orice x real 


ii) Ln/2]+[n/2]= n 
pentru orice n întreg 


iii) ÎIn/albl=Înrab] şi Lla/al/b]=Ln/ab] 
pentru orice n, a, b întregi (a, b #0) 


iv) [n/m] = [(n-m+1)/m] şi [n/m] = | (n+m-1)/m] 


pentru orice numere întregi pozitive n şi m 


In fine, arătați că un arbore binar complet cu n vârfuri are înălțimea Lig nl. 


3.4 Heap-uri 

Un heap (în traducere aproximativă, “grămadă ordonată”) este un arbore binar 
complet, cu următoarea proprietate, numită proprietate de heap: valoarea fiecărui 
vârf este mai mare sau egală cu valoarea fiecărui fiu al său. Figura 3.5 prezintă un 
exemplu de heap. 


Acelaşi heap poate fi reprezentat secvențial prin următorul tablou: 


io | 7 | 9 | a | 7 | 5 [2 [|2] 1| 6| 

TUI T2] TB] TMA TIS] 716] 17 718] 79] 110] 
Caracteristica de bază a acestei structuri de dată este că modificarea valorii unui 
vârf se face foarte eficient, păstrându-se proprietatea de heap. Dacă valoarea unui 
vârf creşte, astfel încât depăşeşte valoarea tatălui, este suficient să schimbăm între 
ele aceste două valori şi să continuăm procedeul în mod ascendent, până când 
proprietatea de heap este restabilită. Vom spune că valoarea modificată a fost 
filtrată ( percolated ) către noua sa poziţie. Dacă, dimpotrivă, valoarea vârfului 
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Figura 3.5 Un heap. 
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scade, astfel încât devine mai mică decât valoarea cel puţin a unui fiu, este 
suficient să schimbăm între ele valoarea modificată cu cea mai mare valoare a 
fiiilor, apoi să continuăm procesul în mod descendent, până când proprietatea de 
heap este restabilită. Vom spune că valoarea modificată a fost cernută (sifted 
down) către noua sa poziţie. Următoarele proceduri descriu formal operaţiunea de 
modificare a valorii unui vârf într-un heap. 


procedure alter-heap(T[1 .. n], i, v) 
{T[1 .. n] este un heap; lui T[i], 1 < i < n, i se atribuie 
valoarea v şi proprietatea de heap este restabilită) 
x < T[i] 
T[i] —v 
ifv<x then sift-down(T, i) 
else percolate(T, i) 


procedure sift-down(T[1 .. n], i) 

{se cerne valoarea din T[i]} 

kei 

repeat 
jek 
{găseşte fiul cu valoarea cea mai mare) 
if 2j < n and T[2j] > T[k] then k — 2j 
if 2j < n and T[2j+1] > T[k] then k & 2j+1 
interschimbă T[ j] şi T[k] 

until j = k 


procedure percolate(T[1 .. n], i) 

{se filtrează valoarea din T[i]} 

kei 

repeat 
jek 
if j > 1 and T[ j div 2] < T[k] then k & j div 2 
interschimbăT[ j] şi T[k] 

until j = k 


Heap-ul este structura de date ideală pentru determinarea și extragerea maximului 
dintr-o mulțime, pentru inserarea unui vârf, pentru modificarea valorii unui vârf. 
Sunt exact operațiile de care avem nevoie pentru a implementa o listă dinamică de 
priorități: valoarea unui vârf va da prioritatea evenimentului corespunzător. 
Evenimentul cu prioritatea cea mai mare se va afla mereu la rădăcina heap-ului, 
iar prioritatea unui eveniment poate fi modificată în mod dinamic. Algoritmii care 
efectuează aceste operații sunt: 


function find-max(T|l .. n]) 
{returnează elementul cel mai mare din heap-ul T} 
return 7[1] 
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procedure delete-max(T[1 .. n]) 
{şterge elementul cel mai mare din heap-ul T} 
T[1] — Tln] 
sift-down(T[1 .. n—1], 1) 


procedure insert(T[1 .. n], v) 
{inserează un element cu valoarea v în heap-ul T 
şi restabilește proprietatea de heap} 
T[n+1] & v 
percolate(T{1 .. n+1], n+1) 


Rămâne de văzut cum putem forma un heap pornind de la tabloul neordonat 
T[1 ..n]. O soluție evidentă este de a porni cu un heap vid şi să adăugăm 
elementele unul câte unul. 


procedure slow-make-heap(T[1 .. n]) 
{formează, în mod ineficient, din T un heap} 
for i — 2 to n do percolate(T{1 .. i], i) 


Soluţia nu este eficientă şi, în Capitolul 5, vom reveni asupra acestui lucru. Există 
din fericire un algoritm mai inteligent, care lucrează în timp liniar, după cum vom 
demonstra tot în Capitolul 5. 


procedure make-heap(T[l .. n]) 
(formează din T un heap} 
for i — (n div 2) downto 1 do sift-down[T, i] 


Ne reamintim că în T[n div 2] se află tatăl vârfului din T[n]. Pentru a înţelege cum 
lucrează această procedură, să presupunem că pornim de la tabloul: 


care corespunde arborelui: 


Mai întâi formăm heap-uri din subarborii cu rădăcina la nivelul 1, aplicând 
procedura sift-down rădăcinilor respective: 
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După acest pas, tabloul 7 devine: 


IP REC Ja T ws a paaa] 


Subarborii de la următorul nivel sunt apoi transformați şi ei în heap-uri. Astfel, 
subarborele 


se transformă succesiv în: 


Subarborele de nivel 2 din dreapta este deja heap. După acest pas, tabloul T 
devine: 


EA. RE 208 A A A (N 2 IER (E 200) EC [E 


Urmează apoi să repetăm procedeul şi pentru nivelul 3, obţinând în final heap-ul 
din Figura 3.5. 


Un min-heap este un heap în care proprietatea de heap este inversată: valoarea 
fiecărui vârf este mai mică sau egală cu valoarea fiecărui fiu al său. Evident, 
rădăcina unui min-heap va conţine în acest caz cel mai mic element al heap-ului. 
În mod corespunzător, se modifică şi celelalte proceduri de manipulare a 
heap-ului. 
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Chiar dacă heap-ul este o structură de date foarte atractivă, există totuşi şi 
operaţii care nu pot fi efectuate eficient într-un heap. O astfel de operație este, de 
exemplu, găsirea unui vârf având o anumită valoare dată. 


Conceptul de heap poate fi îmbunătățit în mai multe feluri. Astfel, pentru aplicaţii 
în care se foloseşte mai des procedura percolate decât procedura sift-down, 
rentează ca un vârf neterminal să aibă mai mult de doi fii. Aceasta accelerează 
procedura percolate. Şi un astfel de heap poate fi implementat secvențial. 


Heap-ul este o structură de date cu numeroase aplicaţii, inclusiv o remarcabilă 
tehnică de sortare, numită heapsort. 


procedure heapsort(T[1 .. n]) 
(sortează tabloul T} 
make-heap(T) 
for i — n downto 2 do 

interschimbă T[1] şi T[i] 
sift-down(T[1 .. i—1], 1) 


Structura de heap a fost introdusă (Williams, 1964) tocmai ca instrument pentru 
acest algoritm de sortare. 


3.5 Structuri de mulţimi disjuncte 


Să presupunem că avem N elemente, numerotate de la 1 la N. Numerele care 
identifică elementele pot fi, de exemplu, indici într-un tablou unde sunt memorate 
numele elementelor. Fie o partiție a acestor N elemente, formată din submulțimi 
două câte două disjuncte: $}, $,, ... . Ne interesează să rezolvăm două probleme: 


i) Cum să obţinem reuniunea a două submulțimi, S; U S;. 
ii) Cum să găsim submulțimea care conține un element dat. 


Avem nevoie de o structură de date care să permită rezolvarea eficientă a acestor 
probleme. 


Deoarece submulțimile sunt două câte două disjuncte, putem alege ca etichetă 
pentru o submulțime oricare element al ei. Vom conveni pentru început ca 
elementul minim al unei mulțimi să fie eticheta mulțimii respective. Astfel, 
mulțimea (3, 5, 2, 8] va fi numită “mulțimea 2”. 


Vom aloca tabloul set[1 .. N], în care fiecărei locaţii set[i] i se atribuie eticheta 
submulțimii care conţine elementul i. Avem atunci proprietatea: set[i] < i, pentru 
ISiSN. 


Presupunem că, inițial, fiecare element formează o submulțime, adică seri] = i, 
pentru 1 < i < N. Problemele i) şi ii) se pot rezolva prin următorii algoritmi: 
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function findl(x) 
{returnează eticheta mulțimii care îl conţine pe x) 
return set|x] 


procedure mergel(a, b) 
{fuzionează mulțimile etichetate cu a şi b} 
i a;jeb 
if i > j then interschimbă i şi j 
for k & j to N do 
if set[k] = j then set[k] —i 


Dacă consultarea sau modificarea unui element dintr-un tablou contează ca o 
operație elementară, atunci se poate demonstra (Exercițiul 3.7) că o serie de n 
operații mergel şi findl necesită, pentru cazul cel mai nefavorabil şi pornind de la 


OR 2o : y) 
starea inițială, un timp în ordinul lui n^. 


Încercăm să îmbunătăţim aceşti algoritmi. Folosind în continuare acelaşi tablou, 
vom reprezenta fiecare mulțime ca un arbore cu rădăcină "inversat”. Adoptăm 
următoarea tehnică: dacă set[i] = i, atunci i este atât eticheta unei mulțimi, cât şi 
rădăcina arborelui corespunzător; dacă serli] = j z i, atunci j este tatăl lui i într-un 
arbore. De exemplu, tabloul: 


set| 1]  ser[2] si set[ 10] 


reprezintă arborii: 


care, la rândul lor, reprezintă mulțimile (1,5), (2,4,7,10) şi {3,6,8,9}. Pentru a 
fuziona două mulțimi, trebuie acum să modificăm doar o singură valoare în 
tablou; pe de altă parte, este mai dificil să găsim mulțimea căreia îi aparţine un 
element dat. 


function find2(x) 
{returnează eticheta mulțimii care îl conţine pe x) 
iex 
while set[i] + i do i — set[i] 
return i 
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procedure merge?(a, b) 
{fuzionează mulțimile etichetate cu a şi b} 
ifa<b then set[b] a 
else sera] —b 


O serie de n operaţii find? şi merge? necesită, pentru cazul cel mai nefavorabil şi 
pornind de la starea iniţială, un timp tot în ordinul lui n (Exercițiul 3.7). Deci, 
deocamdată, nu am câştigat nimic față de prima variantă a acestor algoritmi. 
Aceasta deoarece după k apeluri ale lui merge2, se poate să ajungem la un arbore 
de înălțime k, astfel încât un apel ulterior al lui find2 să ne pună în situația de a 
parcurge k muchii până la rădăcină. 


Până acum am ales (arbitrar) ca elementul minim să fie eticheta unei mulțimi. 
Când fuzionăm doi arbori de înălțime h, şi respectiv h,, este bine să facem astfel 
încât rădăcina arborelui de înălțime mai mică să devină fiu al celeilalte rădăcini. 
Atunci, înălțimea arborelui rezultat va fi max(h,, hp), dacă h, + hp, sau h,+l, dacă 
h, = h„. Vom numi această tehnică regulă de ponderare. Aplicarea ei implică 
renunţarea la convenţia ca elementul minim să fie eticheta mulțimii respective. 
Avantajul este că înălțimea arborilor nu mai crește atât de rapid. Putem demonstra 
(Exerciţiul 3.9) că folosind regula de ponderare, după un număr arbitrar de 
fuzionări, pornind de la starea inițială, un arbore având k vârfuri va avea înălțimea 
maximă Lig k]. 


Înălțimea arborilor poate fi memorată într-un tablou H[1 .. N], astfel încât H[i] să 
conţină înălţimea vârfului i în arborele său curent. În particular, dacă a este 
eticheta unei mulțimi, H[a] va conţine înălțimea arborelui corespunzător. Iniţial, 
H[i] =0 pentru 1 <i <N. Algoritmul find? rămâne valabil, dar vom modifica 
algoritmul de fuzionare. 


procedure merge3(a, b) 
{fuzionează mulțimile etichetate cu a şi b; 
presupunem că a + b} 
if Hla] = H[b] 
then H[a] — H[a]+1 
set[b] — a 
else if H[a] > H[b] 
then set|b] — a 
else sera] —b 


O serie de n operaţii find? şi merge3 necesită, pentru cazul cel mai nefavorabil şi 
pornind de la starea iniţială, un timp în ordinul lui n log n. 


Continuăm cu îmbunătățirile, modificând algoritmul find2. Vom folosi tehnica 
comprimării drumului, care constă în următoarele. Presupunând că avem de 
determinat mulțimea care îl conţine pe x, traversăm (conform cu find2) muchiile 
care conduc spre rădăcina arborelui. Cunoscând rădăcina, traversăm aceleaşi 
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(a) (b) 


Figura 3.6 Comprimarea drumului. 


muchii din nou, modificând acum fiecare vârf întâlnit în cale astfel încât să 
conţină direct adresa rădăcinii. Folosind tehnica comprimării drumului, nu mai 
este adevărat că înălțimea unui arbore cu rădăcina a este dată de H[a]. Totuşi, 
Hla] reprezintă în acest caz o limită superioară a înălțimii şi procedura merge 
rămâne, cu această observaţie, valabilă. Algoritmul find? devine: 


function find3(x) 
{returnează eticheta mulțimii care îl conţine pe x} 
rex 
while set[r] + r do r & setir] 
{r este rădăcina arborelui} 
iex 
while i + r do 
j set|i] 
set[i] r 
iej 
return r 
De exemplu, executând operația find3(20) asupra arborelui din Figura 3.6a, 
obținem arborele din Figura 3.6b. 


Algoritmii find3 şi merge3 sunt o variantă considerabil îmbunătățită a 
procedurilor de tip find şi merge. O serie de n operații find3 şi merge3 necesită, 
pentru cazul cel mai nefavorabil şi pornind de la starea inițială, un timp în ordinul 


lui n lg” N, unde lg“ este definit astfel: 


lg” N = min{k | lg lg ...lg N < 0} 
a 


de k ori 
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Demonstrarea acestei afirmaţii este laborioasă și nu o vom prezenta aici. Funcţia 

lg” creşte extrem de încet: lg N <5 pentru orice N < 65536 și lg N<6 pentru 
. 65536 

orice N< 2 


aproximativ 108°, ceea ce este mult mai puțin decât 2 


. Deoarece numărul atomilor universului observabil este estimat la 
65536 ds ata 
„vom întâlni foarte rar o 
. * 

valoare a lui N pentru care lg N> 6. 

De acum încolo, atunci când vom aplica procedurile find3 şi merge3 asupra unor 
mulțimi disjuncte de elemente, vom spune că folosim o structură de mulțimi 
disjuncte. 


O importantă aplicaţie practică a structurilor de mulțimi disjuncte este verificarea 
eficientă a conexității unui graf (Exerciţiul 3.12). 


3.6 Exerciţii 


3.1 Scrieţi algoritmii de inserare şi de ştergere a unui nod pentru o stivă 
implementată prin tehnica tablourilor paralele. 


3.2 Fie G un graf neorientat cu n vârfuri, n > 2. Demonstraţi echivalenţa 
următoarelor propoziţii care caracterizează un arbore: 

i) G este conex şi aciclic. 

ii) G este aciclic şi are n—1 muchii. 

iii) G este conex şi are n—1 muchii. 


iv) G este aciclic şi, adăugându-se o singură muchie între oricare două vârfuri 
neadiacente, se crează exact un ciclu. 


v) G este conex și, dacă se suprimă o muchie oarecare, nu mai este conex. 
vi) Oricare două vârfuri din G sunt unite printr-un drum unic. 


3.3 Elaboraţi şi implementaţi un algoritm de evaluare a expresiilor aritmetice 
postfixate. 
3.4 De ce procedura percolate este mai eficientă dacă admitem că un vârf 


neterminal poate avea mai mult de doi fii? 


3.5 Fie T[1 .. 12] un tablou, astfel încât T[i] = i, pentru i < 12. Determinaţi 
starea tabloului după fiecare din următoarele apeluri de procedură, aplicate 
succesiv: 


make-heap(T); alter-heap(T, 12, 10); alter-heap(T, 1, 6); alter-heap(T, 5, 6) 
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3.6 Implementați un model de simulare a unei liste dinamice de priorități 
folosind structura de heap. 


3.7 În situaţia în care, consultarea sau modificarea unui element din tablou 
contează ca o operaţie elementară, demonstrați că timpul de execuţie necesar 
pentru o secvență de n operaţii findl şi mergel, pornind din starea inițială şi 
pentru cazul cel mai nefavorabil, este în ordinul lui n. Demonstrați aceeaşi 
proprietate pentru find2 şi merge2. 


Soluție: findl necesită un timp constant şi cel mai nefavorabil caz îl reprezintă 
secvenţa: 

merge (N, N-1); find (N) 

merge I(N-1, N—2); find (N) 


merge I(N-n+1, N-n); find (N) 


În această secvenţă, mergel(N-i+1, N-i) necesită un timp în ordinul lui i. Timpul 
total este în ordinul lui 1+2+...+n = n(n+1)/2, deci în ordinul lui n’. Simetric, 
merge2 necesită un timp constant şi cel mai nefavorabil caz îl reprezintă secvența: 
merge2(N, N—1); find2(N) 
merge2(N—1, N—2); find2(N), 


merge2(N-n+1, N-n); find2(N) 


în care find2(i) necesită un timp în ordinul lui i etc. 
3.8 De ce am presupus în procedura merge3 că a +b? 


3.9 Demonstrați prin inducție că, folosind regula de ponderare (procedura 
merge3), un arbore cu k vârfuri va avea după un număr arbitrar de fuzionări şi 
pornind de la starea inițială, înălțimea maximă Lig k]. 


Soluție: Proprietatea este adevărată pentru k = 1. Presupunem că proprietatea este 
adevărată pentru i < k—1 şi demonstrăm că este adevărată şi pentru k. 


Fie T arborele (cu k vârfuri şi de înălţime h) rezultat din aplicarea procedurii 
merge3 asupra arborilor 7, (cu m vârfuri și de înălțime h,) şi T, (cu k-m vârfuri și 
de înălțime h,). Se observă că cel puțin unul din arborii 7, şi T, are cel mult k/2 
vârfuri, deoarece este imposibil să avem m > k/2 şi k-m > k/2. Presupunând că T, 
are cel mult k/2 vârfuri, avem două posibilități: 


i) h, +h, = h< lig (k-m)]< Lig k] 
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ii) h,= h, > h= hi Lig mhi < Lig (k/2) 1 = Lig k] 


3.10  Demonstrați că o serie de n operații find2 şi merge3 necesită, pentru cazul 
cel mai nefavorabil şi pornind de la starea inițială, un timp în ordinul lui n log n. 


Indicaţie: Ţineţi cont de Exerciţiul 3.9 şi arătați că timpul este în ordinul lui 
n lg n. Arătaţi apoi că baza logaritmului poate fi oarecare, ordinul timpului fiind 
n log n. 


3.11 În locul regulii de ponderare, putem adopta următoarea tactică de 
fuzionare: rădăcina arborelui cu mai puţine vârfuri devine fiu al rădăcinii celuilalt 
arbore. Comprimarea drumului nu modifică numărul de vârfuri într-un arbore, 
astfel încât este uşor să memorăm această valoare în mod exact (în cazul folosirii 
regulii de ponderare, după comprimarea drumului, nu se păstrează înălțimea 
exactă a unui arbore). 


Scrieţi o procedură merge4 care urmează această tactică şi demonstraţi un rezultat 
corespunzător Exerciţiului 3.9. 


3.12 Găsiţi un algoritm pentru a determina dacă un graf neorientat este conex. 
Folosiţi o structură de mulțimi disjuncte. 


Indicaţie: Presupunem că graful este reprezentat printr-o listă de muchii. 
Considerăm inițial că fiecare vârf formează o submulțime (în acest caz, o 
componentă conexă a grafului). După fiecare citire a unei muchii (a, b) operăm 
fuzionarea merge3(find3(a), find3(b)), obţinând astfel o nouă componentă conexă. 
Procedeul se repetă, până când terminăm de citit toate muchiile grafului. Graful 
este conex, dacă şi numai dacă tabloul ser devine constant. Analizaţi eficiența 
algoritmului. 


In general, prin acest algoritm obţinem o partiţionare a vârfurilor grafului în 
submulțimi două câte două disjuncte, fiecare submulțime conţinând exact vârfurile 
câte unei componente conexe a grafului. 


3.13 Într-o structură de mulțimi disjuncte, un element x este canonic, dacă nu 
are tată. In procedurile find3 şi merge3 observăm următoarele: 


i) Dacă x este un element canonic, atunci informaţia din ser[x] este folosită doar 
pentru a preciza că x este canonic. 


ii) Dacă elementul x nu este canonic, atunci informaţia din H[x] nu este folosită. 


Ținând cont de i) şi ii), modificaţi procedurile find3 şi merge3 astfel încât, în 
locul tablourilor set şi H, să folosiți un singur tablou de N elemente. 


Indicaţie: Utilizaţi în noul tablou şi valori negative. 


4. Tipuri abstracte de 
date 


În acest capitol, vom implementa câteva din structurile de date prezentate în 
Capitolul 3. Utilitatea acestor implementări este dublă. În primul rând, le vom 
folosi pentru a exemplifica programarea orientată pe obiect prin elaborarea unor 
noi tipuri abstracte. În al doilea rând, ne vor fi utile ca suport puternic și foarte 
flexibil pentru implementarea algoritmilor studiaţi în Capitolele 6-9. Utilizând 
tipuri abstracte pentru principalele structuri de date, ne vom putea concentra 
exclusiv asupra algoritmilor pe care dorim să îi programăm, fără a mai fi necesar 
să ne preocupăm de implementarea structurilor necesare. 


Elaborarea fiecărei clase cuprinde două etape, nu neapărat distincte. În prima, 
vom stabili facilităţile clasei, adică funcţiile şi operatorii prin care se realizează 
principalele operaţii asociate tipului abstract. De asemenea, vom stabili structura 
internă a clasei, adică datele membre şi funcţiile nepublice. Etapa a doua cuprinde 
programarea, testarea şi depanarea clasei, astfel încât, în final, să avem garanţia 
bunei sale funcţionări. Întregul proces de elaborare cuprinde numeroase reveniri 
asupra unor aspecte deja stabilite, iar fiecare modificare atrage după sine o 
întreagă serie de alte modificări. Nu vom prezenta toate aceste iterații, deşi ele au 
fost destul de numeroase, ci doar rezultatele finale, comentând pe larg, atât 
facilităţile clasei, cât și detaliile de implementare. Vom explica astfel și câteva 
aspecte ale programării orientate pe obiect în limbajul C++, cum sunt clasele 
parametrice şi moştenirea (derivarea). Dorim ca prin această manieră de 
prezentare să oferim posibilitatea de a înţelege modul de funcţionare și utilizare al 
claselor descrise, chiar dacă anumite aspecte, legate în special de implementare, 
nu sunt suficient aprofundate. 


4.1 Tablouri 


În mod surprinzător, începem cu tabloul, structură fundamentală, predefinită în 
majoritatea limbajelor de programare. Necesitatea de a elabora o nouă structură 
de acest tip provine din următoarele inconveniente ale tablourilor predefinite, 
inconveniente care nu sunt proprii numai limbajelor C şi C++: 


e Numărul elementelor unui tablou trebuie să fie o expresie constantă, fixată în 
momentul compilării. 


e Pe parcursul execuţiei programului este imposibil ca un tablou să fie mărit sau 
micşorat după necesităţi. 
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e Nu se verifică încadrarea în limitele admisibile a indicilor elementelor 
tablourilor. 


e Tabloul şi numărul elementelor lui sunt două entități distincte. Orice operaţie 
cu tablouri (atribuiri, transmiteri de parametri etc) impune specificarea 
explicită a numărului de elemente ale fiecărui tablou. 


4.1.1 Alocarea dinamică a memoriei 


Diferenţa fundamentală dintre tipul abstract pe care îl vom elabora şi tipul tablou 
predefinit constă în alocarea dinamică, în timpul execuţiei programului, a 
spaţiului de memorie necesar stocării elementelor sale. În limbajul C, alocarea 
dinamică se realizează prin diversele variante ale funcţiei malloc(), iar 
eliberarea zonelor alocate se face prin funcţia mfree (). Limbajul C++ a introdus 
alocarea dinamică în structura limbajului. Astfel, pentru alocare avem operatorul 
new. Acest operator returnează adresa” zonei de memorie alocată, sau valoarea 0 — 
dacă alocarea nu s-a putut face. Pentru eliberarea memoriei alocate prin 
intermediul operatorului new, se foloseşte un alt operator numit delete. 
Programul următor exemplifică detaliat funcţionarea acestor doi operatori. 


tinclude <iostream.h> 
+include "intErval.h" 


int main ) { 
// Operatorul new are ca argumente numele unui tip T 
// (predefinit sau definit de utilizator) si dimensiunea 
// zonei care va fi alocata. Valoarea returnata este de 
// tip "pointer la T". Operatorul new returneaza 0 in 
// cazul in care alocarea nu a fost posibila. 


// se aloca o zona de 2048 de intregi 
int *pi = new int [ 2048 ]; 


// se aloca o zona de 64 de elemente de tip 


// intErval cu domeniul implicit 
intErval *pi_m = new intEărval [ 64 |]; 


// se aloca o zona de 8192 de elemente de tip float 
float *pf = new float [ 8192 |]; 


În limbajul C++, tipul de dată care conţine adrese este numit pointer. În continuare, vom folosi 
termenul “pointer”, doar atunci când ne referim la tipul de dată. Termenul “adresă” va fi folosit 
pentru a ne referi la valoarea datelor de tip pointer. 
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// De asemenea, operatorul new poate fi folosit pentru 
// alocarea unui singur element de un anumit tip T, 

// precizand eventual si argumentele constructorului 
// tipului respectiv. 


// se aloca un intreg initializat cu 8 


int Xa. 


= new int( 8 ); 


// se aloca un element de tip intErval 
ff cu domeniul admisibil =I; ..., 15 
intErval *m = new intărval( 16, -16 ); 


11 se aloca un numar real (float) initializat cu 32 
float *f = new float( 32 ); 


// Zonele alocate pot fi eliberate oricand si in orice 
// ordine, dar numai prin intermediul pointerului 
// returnat de operatorul new. 


delete 
delete 
delete 
delete 
delete 
delete 


return 


] pf; 
] pi; 
i; 
f; 


] pim; 
m; 


0; 


Operatorul new inițializează memoria alocată prin intermediul constructorilor 
tipului respectiv. În cazul alocării unui singur element, se invocă constructorul 
corespunzător argumentelor specificate, iar în cazul alocării unui tablou de 
elemente, operatorul new invocă constructorul implicit pentru fiecare din 
elementele alocate. Operatorul delete, înainte de eliberarea spațiului alocat, va 
invoca destructorul tipului respectiv. Dacă zona alocată conține un tablou de 
elemente şi se doreşte invocarea destructorului pentru fiecare element în parte, 
operatorul delete va fi invocat astfel: 


delete [ 


] pointer; 


De exemplu, rulând programul 
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tinclude <iostream.h> 


class X | 


public: 
Si 9 | cout ce ter. | 
aX J 4 Cat s< Tete } 
private: 
int x} 
}; 
int main( ) { 


ate. <4 Tins 


X *p =new X [ 4 |]; 
delete p; 


p = new X [2 ]; 
delete [ ] p; 


eat. 4< Tins 
return 0; 


constatăm că, în alocarea zonei pentru cele patru elemente de tip X, constructorul 
X() a fost invocat de patru ori, iar apoi, la eliberare, destructorul ~X() doar o 
singură dată. În cazul zonei de două elemente, atât constructorul cât şi 
destructorul au fost invocaţi de câte două ori. Pentru unele variante mai vechi de 
compilatoare C++, este necesar să se specifice explicit numărul elementelor din 
zona ce urmează a fi eliberată. 


În alocarea dinamică, cea mai uzuală eroare este generată de imposibilitatea 
alocării memoriei. Pe lângă soluţia banală, dar extrem de incomodă, de testare a 
valorii adresei returnate de operatorul new, limbajul C++ oferă şi posibilitatea 
invocării, în caz de eroare, a unei funcţii definite de utilizator. Rolul acesteia este 
de a obţine memorie, fie de la sistemul de operare, fie prin eliberarea unor zone 
deja ocupate. Mai exact, atunci când operatorul new nu poate aloca spaţiul 
solicitat, el invocă funcţia a cărei adresă este dată de variabila globală 
_new handler şi apoi încearcă din nou să aloce memorie. Variabila 
_new_handler este de tip “pointer la funcție de tip void fără nici un argument”, 
void (*_new_handler) (), valoarea ei implicită fiind 0. 


Valoarea O a pointerului _new handler marchează lipsa funcţiei de tratare a 
erorii şi, în această situație, operatorul new va returna 0 ori de câte ori nu poate 
aloca memoria necesară. Programatorul poate modifica valoarea acestui pointer, 
fie direct: 


_new_handler = no_mem; 


unde no_mem este o funcţie de tip void fără nici un argument, 
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void no_mem( ) { 
cere 4< Tinin ño mem: Na 
exit( 1 ); 

) 


fie prin intermediul funcţiei de bibliotecă set _new_handler: 


set_new_handler( no_men ); 


Toate declaraţiile necesare pentru utilizarea pointerului _new_handler se găsesc 
în fişierul header new.h. 


4.1.2 Clasa tablou 


Noul tip, numit tablou, va avea ca date membre numărul de elemente şi adresa 
zonei de memorie în care sunt memorate acestea. Datele membre fiind private, 
adică inaccesibile din exteriorul clasei, oferim posibilitatea obţinerii numărului 
elementelor tabloului prin intermediul unei funcţii membre publice numită 
size (). lată definiţia completă a clasei tablou. 


class tablou { 
publice: 
// constructorii si destructorul 
tablou( int = 0); // constructor (numarul de elemente) 
tablou( const tabloue ); // constructor de copiere 
-tablou( ) ( delete a; ) // elibereaza memoria alocata 


// operatori de atribuire si indexare 
tablou operator =( const tablou ); 
int& operator []( int j; 


// returneaza numarul elementelor 
size( ) { return d; ) 


private: 
int d; // numarul elementelor (dimensiunea) tabloului 
int *a; // adresa zonei alocate 


// functie auxiliara de initializare 


void init{ const tablou& ); 


); 


Definiţiile funcţiilor membre sunt date în continuare. 
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tablou: tablou int dim J 4 


a = VO: d = 0y // valori implicite 
if | dim > 0 3 // verificarea dimensiunii 
a = new int [ d = dim ]; // alocarea memoriei 


) 


tablou: ;tabloui const tablou € ) { 
// initializarea obiectului invocator cu t 
init( t Jj 

) 


tablou tablou::operator =( const tablou t ) { 


if ( this != &t ) { // este o atribuire inefectiva x = x? 
delete a; // eliberarea memoriei alocate 
init e fy 1 initializarea cu t 

) 

return *this; // se returneaza obiectul invocator 


} 


void tablou::init( const tabloue t) { 
a= iy d = 0z // valori implicite 
if | Es > 0 d 4 // verificarea dimensiunii 
a = new int [ d = t.d ]; // alocarea si copierea elem. 
memcpy( a, t.a, d * sizeof( int) ); 
) 
) 


inté tablou::operator []( int i) 4 
static int z; // "elementul" tablourilor de dimensiune zero 
return d? al îi |]: z; 


Fără îndoială că cea mai spectaculoasă definiţie este cea a operatorului de 
indexare []. Acesta permite atât citirea unui element dintr-un tablou: 


tablou (a ); 
Fi 


cout << x[ i Ji 


cât şi modificarea valorii (scrierea) lui: 


cin >> X i J; 


Facilitățile deosebite ale operatorului de indexare [] se datorează tipului valorii 
returnate. Acest operator nu returnează elementul i, ci o referință la elementul i, 
referință care permite accesul atât în scriere, cât și în citire a variabilei de la 
adresa respectivă. 


Clasa tablou permite utilizarea tablourilor în care nu există nici un element. 
Operatorul de indexare [] este cel mai afectat de această posibilitate, deoarece 
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într-un tablou cu zero elemente va fi greu de găsit un element a cărui referință să 
fie returnată. O soluţie posibilă constă în returnarea unui element fictiv, unic 
pentru toate obiectele de tip tablou. În cazul nostru, acest element este variabila 
locală static int z, variabilă alocată static, adică pe toată durata rulării 
programului. 


O atenţie deosebită merită şi operatorul de atribuire =. După cum am precizat în 
Secţiunea 2.3, structurile pot fi atribuite între ele, membru cu membru. Pentru 
clasa tablou, acest mod de funcţionare a operatorului implicit de atribuire este 
inacceptabil, deoarece generează referiri multiple la aceeaşi zonă de memorie. 
lată un exemplu simplu de ceea ce înseamnă referiri multiple la aceeaşi zonă de 
memorie. 


Fie x şi y două obiecte de tip tablou. În urma atribuirii x = y prin operatorul 
predefinit =, ambele obiecte folosesc aceeași zonă de memorie pentru memorarea 
elementelor. Dacă unul dintre ele încetează să mai existe, atunci destructorul său 
îi va elibera zona alocată. În consecinţă, celălalt va lucra într-o zonă de memorie 
considerată liberă, zonă care poate fi alocată oricând altui obiect. Prin definirea 
unui nou operator de atribuire specific clasei tablou, obiectele din această clasă 
sunt atribuite corect, fiecare având propria zonă de memorie în care sunt 
memorate elementele. 


O altă observaţie relativă la operatorul de atribuire se referă la valoarea returnată. 
Tipurile predefinite permit concatenarea operatorului de atribuire în expresii de 
forma 


i = j= k; 
// unde i, j si k sunt variabile de orice tip predefinit 


Să vedem ce trebuie să facem ca, prin noul operator de atribuire definit, să putem 
scrie 


iT = jT = kT; 
// iT, IT si kT sunt obiecte de tip tablou 


Operatorul de atribuire predefinit are asociativitate de dreapta (se evaluează de la 
dreapta la stânga) şi această caracteristică rămâne neschimbată la supraîncărcare. 
Altfel spus, iT = jT = kT înseamnă de fapt iT = (jT = kT), sau 
operator =( iT, operator =( jT, kT) ). Rezultă că operatorul de atribuire 
trebuie să returneze operandul stâng, sau o referință la acesta. În cazul nostru, 
operandul stâng este chiar obiectul invocator. Cum în fiecare funcţie membră este 
implicit definit un pointer la obiectul invocator, pointer numit this (acesta), 
operatorul de atribuire va returna o referință la obiectul invocator prin 
instrucțiunea 
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return *this; 


Astfel, sintaxa de concatenare poate fi folosită fără nici o restricţie. 


In definiția clasei tablou a apărut un nou constructor, constructorul de copiere 


tablou( const tablous ) 


Este un constructor a cărui implementare seamănă foarte mult cu cea a 
operatorului de atribuire. Rolul său este de a inițializa obiecte de tip tablou cu 
obiecte de același tip. O astfel de operaţie, ilustrată în exemplul de mai jos, este 
în mare măsură similară unei copieri. 


tablou xj 
i7 


tablou y = x} // se invoca constructorul de copiere 


In lipsa constructorului de copiere, inițializarea se face implicit, adică membru cu 
membru. Consecințele negative care decurg de aici au fost discutate mai sus. 


4.1.3 Clasa parametrică tablou<T> 


Utilitatea clasei tablou este strict limitată la tablourile de întregi, deşi un tablou 
de float, char, sau de orice alt tip T, se manipulează la fel, funcțiile şi datele 
membre fiind practic identice. Pentru astfel de situații, limbajul C++ oferă 
posibilitatea generării automate de clase şi funcții pe baza unor şabloane 
(template). Aceste şabloane, numite şi clase parametrice, respectiv funcții 
parametrice, depind de unul sau mai mulți parametri care, de cele mai multe ori, 
sunt tipuri predefinite sau definite de utilizator. 


Şablonul este o declarație prin care se specifică forma generală a unei clase sau 
funcții. Iată un exemplul simplu: o funcție care returnează maximul a două valori 
de tip T. 


template <class T> 
T maxi Ta, Thid 
return a > b? a: b} 


} 


Acest şablon se citeşte astfel: max () este o funcție cu două argumente de tip T, 
care returnează maximul celor două argumente, adică o valoare de tip T. Tipul T 
poate fi orice tip predefinit, sau definit de utilizator, cu conditia să aibă definit 
operatorul de comparare >, fără de care funcția max () nu poate funcționa. 
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Compilatorul nu generează nici un fel de cod pentru şabloane, până în momentul 
în care sunt efectiv folosite. De aceea, şabloanele se specifică în fişiere header, 
fişiere incluse în fiecare program sursă C++ în care se utilizează clasele sau 
funcţiile parametrice respective . De exemplu, în funcţia 


void fi int ia, int ib, float fa ) 4 
int mL = maxi ia; ib Jý 
float m2 max( ia, fa ); 


se invocă funcţiile int max(int, int) şi float max(float, float), funcţii 
generate automat, pe baza şablonului de mai sus 


Conform specificaţiilor din Ellis şi Stroustrup, “The Annotated C++ Reference 
Manual”, generarea şabloanelor este un proces care nu implică nici un fel de 
conversii. În consecinţă, linia 


float m2 = max( ia, fa J; 


este eronată. Unele compilatoare nu semnalează această erorare, deoarece invocă 
totuşi conversia lui ia din int în float. Atunci când compilatorul semnalează 
eroarea, putem declara explicit funcţia (vezi şi Secţiunea 10.2.3) 


float maxi float, float J; 


declaraţie care nu mai necesită referirea la şablonul funcţiei max (). Această 
declaraţie este, în general, suficientă pentru a genera funcția respectivă pe baza 
şablonului. 


Până când limbajul C++ va deveni suficient de matur pentru a fi standardizat, 
“artificiile” de programare de mai sus sunt deseori indispensabile pentru utilizarea 
şabloanelor. 


Pentru șabloanele de clase, lucrurile decurg aproximativ în acelaşi mod, adică 
generarea unei anumite clase este declanșată de definițiile întâlnite în program. 
Pentru clasa parametrică tablou<T> definițiile 


În prezent sunt utilizate două modele generale pentru instanțierea (generarea) şabloanelor, fiecare 
cu anumite avantaje şi dezavantaje. Reprezentative pentru aceste modele sunt compilatoarele 
Borland C++ şi translatoarele Cfront de la AT&T. Ambele modele sunt compatibile cu plasarea 
şabloanelor în fişiere header. 
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tablou<float> y( 16); 
tablou<int> x( 32 ); 
tablou<unsigned char> z( 64); 
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provoacă generarea clasei tablou<T> pentru tipurile float, int şi unsigned 


char. Fişierul header (tablou.h) al acestei clase este: 


+ifndef ___TABLOU_H 
+define ___TABLOU_H 


tinclude <iostream.h> 


template <class T> 
class tablou { 


publie: 
// constructorii si destructorul 
tabloul int = 0 J3 // constructor (numarul de elemente) 
tablou( const tablou ); // constructor de copiere 
-tablou( ) { delete [ ] a; ) // elibereaza memoria alocata 


// operatori de atribuire si indexare 
tablou operator =( const tablou ); 
T& operator []{ int ); 


// returneaza numarul elementelor 
size( ) { return d; ) 


// activarea/dezactivarea verificarii indicilor 
void vân (J) 4 = ie } 
void vOCE( ) 4 7 = 07 | 


protected: 
int d; // numarul elementelor (dimensiunea) tabloului 
T *a; // adresa zonei alocate 


char v; // indicator verificare indice 


// functie auxiliara de initializare 
void init( const tablou& )ș 


); 


template<class T> 
tablou<T>:ttablouüu( int dim y | 
a 0; v 0 d 0? // valori implicite 
if (dim > 9) // verificarea dimensiunii 
a = new T [ d = dim |]; // alocarea memoriei 
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template <class T> 
tablouzT>: tabloul const tablou<T>s ÈE ) { 
// initializarea obiectului invocator cu t 
init( © Jj 
J 


template <class T> 
tablou<T>& tablou<T>::operator =( const tablou<T>& t) { 


if (this != st ) 1 // este co atribuire inefectiva x = X? 
delete ] a; // eliberarea memoriei alocate 
initi & J} f} initializarea cu t 

) 

return *this; // se returneaza obiectul invocator 


) 


template<class T> 
void tablou<sT>tsinit( const tablouxT>e © ) 4 


a 0; v Ge a 0; // valori implicite 

LE | Ed >= 0 4 // verificarea dimensiunii 
a = new T [| d = t.d ]; // alocarea si copierea elem. 
for 4 int i = 07 1 < d; i++} al iJ] = tal 2 Jj 
v= t.v; // duplicarea indicatorului 

} // pentru verificarea indicilor 


) 


template< class T > 
Té tablou<T>::operator []( int i) 4 
statie T z} // elementul returnat in caz de eroare 


ad a = ) // tablou de dimensiune zero 
return zZz}; 


IE des || 4 oi ge ic ay) 
// verificarea indicilor este dezactivata, 
// sau este activata si indicele este corect 
return al i |]; 


cerr << "inintablou == T <<i 
<< ": indice exterior domeniului [0, 
ss g da a ee Tekni 


return z; 


Intr-o primă aproximare, diferențele față de clasa neparametrică tablou sunt 
următoarele: 


Nivelul de incapsulare protected a înlocuit nivelul private. Este o 
modificare necesară procesului de derivare al claselor, prezentat în secțiunile 
următoare. 

Eliberarea zonei alocate dinamic trebuie să se realizeze prin invocarea 
destructorului tipului T pentru fiecare element. Deci, în loc de delete a, este 
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obligatoriu să scriem delete [] a atât în destructor, cât şi în operatorul de 
atribuire. De asemenea, copierea elementelor în funcţia init() nu se mai 
poate face global, prin memcpy (), ci element cu element, pentru a invoca astfel 
opratorul de atribuire al tipului T. 


e Prezenţa definiţiilor funcțiilor membre în fişierul header nu este o greşeală. De 
fapt, este vorba de şabloanele funcţiilor membre. 


Printre inconvenientele tablourilor predefinite am enumerat și imposibilitatea 
detectării indicilor eronați. După cum se observă, am completat clasa parametrică 
tablou<T> cu funcţiile publice von () şi vOff (), prin care se activează, respectiv 
se dezactivează, verificarea indicilor. În funcţie de valoarea logică a variabilei 
private v, valoare stabilită prin funcţiile von () şi vOff (), operatorul de indexare 
va verifica, sau nu va verifica, corectitudinea indicelui. Operatorul de indexare a 
fost modificat corespunzător. 


Pentru citirea şi scrierea obiectelor de tip tablou<T>, supraîncărcăm operatorii 
respectivi (>> şi <<) ca funcții nemembre. Convenim ca, în operaţiile de 
citire/scriere, să reprezentăm tablourile în formatul 


[dimensiune] elementi element? 


Cei doi operatori pot fi implementaţi astfel: 


template <class T> 
istream& operator >>( istreame is, tablou<T>& t ) { 
ahar cj 


// citirea dimensiunii tabloului incadrata de '[' si !]! 


is >> Gi 

if (e Ts T[* } {f is.cleari igs¿:railbit )ș; return is; | 
me m 18 5> rnp is >> -€j 

if (6 Tts 1T]* ) { is.cleari igs¿crailbit )ș return is; | 


// modificarea dimensiunii tabloului, 
// evitand copierea elementelor existente 
t.newsize( 0 ).newsize( n ); 


// citirea elementelor 
for- ( int 1 = 0s i4 n ais >r tl iTr | J 


return is; 
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template <class T> 


ostream& operator <<( ostreame& os, tablou<T>& t ) { 
int n = t.size( ); 
os se " [" er n PRA g : Ma 
for { int i = Q} 1 < n; 05 << t i++ ] as! T Jå 


return os; 


Aceşti operatori sunt utilizabili doar dacă obiectelor de tip T li se pot aplica 
operatorii de extragere/inserare >>, respectiv <<. În caz contrar, orice încercare de 
a aplica obiectelor de tip tablou<T> operatorii mai sus definiți, va fi semnalata ca 
eroare la compilarea programului. 


Operatorul de extragere (citire) >> prezintă o anumită particularitate față de 
celelalte funcţii care operează asupra tablourilor: trebuie să modifice chiar 
dimensiunea tabloului. Două variante de a realiza această operaţie, dintre care una 
prin intermediul funcţiei newsize ( ), sunt discutate în Exerciţiile 4.2 şi 4.3. 


Marcarea erorilor la citire se realizează prin modificarea corespunzătoare a stării 
istream-ului prin 


1s.cleari ios::fal Ipit }ż 


După cum am precizat în Secţiunea 2.3.2, starea unui istream se poate testa 
printr-un simplu if ( cin >> ... ). Odată ce un istream a ajuns într-o stare 
de eroare, nu mai răspunde la operatorii respectivi, decât după ce este readus la 
starea normală de utilizare prin instrucţiunea 


is.clear(); 


4.2 Stive, cozi, heap-uri 


Stivele, cozile şi heap-urile sunt, în esenţă, tablouri manipulate altfel decât prin 
operatorul de indexare. Acesată afirmaţie contrazice aparent definițiile date în 
Capitolul 3. Aici se precizează că stivele şi cozile sunt liste liniare în care 
inserările/extragerile se fac conform unor algoritmi particulari, iar heap-urile sunt 
arbori binari compleţi. Tot în Capitolul 3 am arătat că reprezentarea cea mai 
comodă pentru toate aceste structuri este cea secvențială, bazată pe tablouri. 


În terminologia specifică programării orientate pe obiect, spunem că tipurile 
stiva<T>, coada<T> şi heap<T> sunt derivate din tipul tablou<T>, sau că 
moștenesc tipul tablou<T>. Tipul tablou<T> se numeşte tip de bază pentru 
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tipurile stiva<T>, coada<T> şi heap<T>. Prin moştenire, limbajul C++ permite 
atât crearea unor subtipuri ale tipului de bază, cât și crearea unor tipuri noi, 
diferite de tipul de bază. Stivele, cozile şi heap-urile vor fi tipuri noi, diferite de 
tipul de bază tablou. Posibilitatea de a crea subtipuri prin derivare, o facilitate 
deosebit de puternică a programării orientate pe obiect şi a limbajului C++, va fi 
exemplificată în Secţiunile 11.1 şi 10.2. 


4.2.1 Clasele stiva<T> şi coada<T> 


Clasa stiva<T> este un tip nou, derivat din clasa tablou<T>. În limbajul C++, 
derivarea se indică prin specificarea claselor de bază (pot fi mai multe!), imediat 
după numele clasei. 


template <class T> 

class stiva: private tablou<T> { 
LA 

); 


Fiecare clasă de bază este precedată de atributul public sau private, prin care 
se specifică modalitatea de moştenire. O clasă derivată public este un subtip al 
clasei de bază, iar una derivată private este un tip nou, distinct față de tipul de 
bază. 


Clasa derivată moşteneşte toți membrii clasei de bază, cu excepţia constructorilor 
şi destructorilor, dar nu are acces la membrii private ai clasei de bază. Atunci 
când este necesar, acest incovenient poate fi evitat prin utilizarea în clasa de bază 
a nivelului de acces protected în locul celui private. Membrii protected sunt 
membri privaţi, dar accesibili claselor derivate. Nivelul de acces al membrilor 
moşteniţi se modifică prin derivare astfel: 


e Membrii neprivaţi dintr-o clasă de bază publică îşi păstrează nivelele de acces 
şi în clasa derivată. 

e Membrii neprivaţi dintr-o clasă de bază privată devin membri private în clasa 
derivată. 

Revenind la clasa stiva<T>, putem spune că moşteneşte de la clasa de bază 

tablou<T> membrii 


inte d} 
T *a; 


ca membri private, precum şi cei doi operatori (publici în clasa tablou<T>) 
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tablou operator =( const tablou ); 
T& operator []( int ); 


tot ca membri private. 


Pe baza celor de mai sus, se justifică foarte simplu faptul că prin derivarea privată 
se obţin tipuri noi, total distincte față de tipul de bază. Astfel, nu este disponibilă 
nici una din facilitățile clasei de bază tablou<T> în exteriorul clasei stiva<T>, 
existenţa clasei de bază fiind total ascunsă utilizatorului. În schimb, pentru 
implementarea propriilor facilități, clasa stiva<T> poate folosi din plin toţi 
membrii clasei tablou<T>. Prin derivarea private, realizăm deci o reutilizare a 
clasei de bază. 


Definirea unei stive derivată din tablou se realizează astfel (fişierul stiva.h): 


+ifndef __STIVA_H 
+define __STIVA_H 


tinclude <iostream.h> 
include "tablou.h" 


template <class T> 
class stiva: private tablou<T> { 
public: 
stiva int d): tabloucT>( d) { s = =i ) 


push( const Te ); 
pop | T& ); 


private: 
int s; // indicele ultimului element inserat 
); 


template <class T> 

tivasi»: pushi const Te y ) | 
iE (g >= ds 1) return 0; 
al ++s ] = v; return 1; 


} 


template <class T> 
stivati»: pop TE y f 4 


if p &«<«0} return 0; 
v = al s-- ]; return 1; 
) 
tendi f 


Înainte de a discuta detaliile de implementare, să remarcăm o anumită 
inconsecvență apărută în definiția funcţiei pop() din Secţiunea 3.1.1. Această 
funcţie returnează fie elementul din vârful stivei, fie un mesaj de eroare (atunci 
când stiva este vidă). Desigur că nu este un detaliu deranjant atât timp cât ne 


Secțiunea 4.2 Stive, cozi, heap-uri 71 


interesează doar algoritmul. Dar, cum implementăm efectiv această funcţie, astfel 
încât să cuprindem ambele situaţii? Întrebarea poate fi formulată în contextul mult 
mai general al tratării excepțiilor. Rezolvarea unor cazuri particulare, a 
excepțiilor de la anumite reguli, problemă care nu este strict de domeniul 
programării, poate da mai puţine dureri de cap prin aplicarea unor principii foarte 
simple. lată, de exemplu, un astfel de principiu formulat de Winston Churchill: 
“Nu mă intrerupeţi în timp ce întrerup”. 


Tratarea excepțiilor devine o chestiune foarte complicată, mai ales în cazul 
utilizării unor funcţii sau obiecte dintr-o bibliotecă. Autorul unei biblioteci de 
funcţii (obiecte) poate detecta excepţiile din timpul execuţiei dar, în general, nu 
are nici o idee cum să le trateze. Pe de altă parte, utilizatorul bibliotecii ştie ce să 
facă în cazul apariţiei unor excepții, dar nu le poate detecta. Noţiunea de excepție, 
noțiune acceptată de Comitetul de standardizare ANSI C++, introduce un 
mecanism consistent de rezolvare a unor astfel de situaţii. Ideea este ca, în 
momentul când o funcţie detectează o situație pe care nu o poate rezolva, să 
semnaleze (throw) o excepţie, cu speranța că una din funcţiile (direct sau 
indirect) invocatoare va rezolva apoi problema. O funcție care este pregătită 
pentru acest tip de evenimente îşi va anunţa în prealabil disponibilitatea de a trata 
(catch) excepţii. 


Mecanismul schițat mai sus este o alternativă la tehnicile tradiţionale, atunci când 
acestea se dovedesc a fi inadecvate. El oferă o cale de separare explicită a 
secvenţelor pentru tratarea erorilor de codul propriu-zis, programul devenind 
astfel mai clar şi mult mai uşor de întreţinut. Din păcate, la nivelul anului 1994, 
foarte puţine compilatoare C++ implementează complet mecanismul throw- 
catch. Revenim de aceea la “stilul clasic”, stil independent de limbajul de 
programare folosit. Uzual, la întâlnirea unor erori se acţionează în unul din 
următoarele moduri: 


e Se termină programul. 
e Se returnează o valoare reprezentând “eroare”. 
e Se returnează o valoare legală, programul fiind lăsat într-o stare ilegală. 


e Se invocă o funcție special construită de programator pentru a fi apelată în caz 
de eroare. 


Terminarea programului se realizează prin revenirea din funcția main (), sau prin 
invocarea unei funcţii de bibliotecă numită exit (). Valoarea returnată de main (), 
precum şi argumentul întreg al funcţiei exit (), este interpretat de sistemul de 
operare ca un cod de retur al programului. Un cod de retur nul (zero) semnifică 
executarea corectă a programului. 


Până în prezent, am utilizat tratarea excepțiilor prin terminarea programului în 
clasa intErval. Un alt exemplu de tratare a excepțiilor se poate remarca la 
operatorul de indexare din clasa tablou<T>. Aici am utilizat penultima alternativă 
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din cele patru enunțate mai sus: valoarea returnată este legală, dar programul nu a 
avut posibilitatea de a trata eroarea. 


Pentru stivă şi, de fapt, pentru multe din structurile implementate aici şi 
susceptibile la situaţii de excepţie, am ales varianta a doua: returnarea unei valori 
reprezentând “eroare”. Pentru a putea distinge cât mai simplu situaţiile normale de 
cazurile de excepţie, am convenit ca funcţia pop() să transmită elementul din 
vârful stivei prin intermediul unui argument de tip referință, valoarea returnată 
efectiv de funcţie indicând existenţa sau inexistența acestui element. Astfel, 
secvenţa 


while( s.pop(v) ) í 
Îi 


se execută atât timp cât în stiva s mai sunt elemente, variabila v având de fiecare 
dată valoarea elementului din vârful stivei. Funcţia push () are un comportament 
asemănător, secvenţa 


while( s.push( v ) ) { 
fă 


executându-se atâta timp cât în stivă se mai pot insera elemente. 


În continuare, ne propunem să analizăm mai amănunţit contribuţia clasei de bază 
tablou<T> în funcționarea clasei stiva<T>. Să remarcăm mai întâi invocarea 
constructorului tipului de bază pentru iniţializarea datelor membre moştenite, 
invocare realizată prin lista de inițializare a membrilor: 


stiva int d J tablouci>i| d) | e = el; ) 


Utilizarea acestei sintaxe speciale se datorează faptului că execuţia oricărui 
constructor se face în două etape. Într-o primă etapă, etapă de inițializare, se 
invocă constructorii datelor membre moştenite de la clasele de bază, conform 
listei de inițializare a membrilor. În a doua etapă, numită etapă de atribuire, se 
execută corpul propriu-zis al constructorului. Necesitatea unei astfel de etapizări 
se justifică prin faptul că inițializarea membrilor moşteniţi trebuie rezolvată în 
mod unitar de constructorii proprii, şi nu de cel al clasei derivate. Dacă lista de 
inițializare a membrilor este incompletă, atunci, pentru membrii rămași 
neinițializaţi, se invocă constructorii impliciți. De asemenea, tot în etapa de 
inițializare se vor invoca constructorii datelor membre de tip clasă şi se vor 
inițializa datele membre de tip const sau referință. 


Continuând analiza contribuţiei tipului de bază tablou<T>, să remarcăm că în 
clasa stiva<T> nu s-au definit constructorul de copiere, operatorul de atribuire şi 
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destructorul. Iniţializarea şi atribuirea obiectelor de tip stivă cu obiecte de acelaşi 
tip, precum şi distrugerea acestora, se realizează totuşi corect, datele membre 
moștenite de la tablou<T> fiind manipulate de funcţiile membre ale acestui tip. În 
funcţia 


yöid El > { 
stivacint> x( 15 J} 
stiva<int> y = x; 
x = yi 


inițializarea lui y cu x se face membru cu membru, pentru datele proprii clasei 
stiva<T> (întregul top), şi prin invocarea constructorului de copiere al clasei 
tablou<T>, pentru inițializarea datelor membre moştenite (întregul d şi adresa a). 
Atribuirea x = y se efectuează membru cu membru, pentru datele proprii, iar 
pentru cele moştenite, prin invocarea operatorului de atribuire al clasei 
tablou<T>. La terminarea funcției, obiectele x şi y vor fi distruse prin invocarea 
destructorilor în ordinea inversă a invocării constructorilor, adică destructorul 
clasei stiva<T> (care nu a fost precizat pentru că nu are de făcut nimic) şi apoi 
destructorul clasei de bază tablou<T>. 


Implementarea clasei coada<T> se face pe baza precizărilor din Secțiunea 3.1.2, 
direct prin modificarea definiției clasei stiva<T>. În locul indicelui top, vom 
avea două date membre, şi anume indicii head şi tail, iar funcțiile membre 
push () şi pop () vor fi înlocuite cu ins_q(), respectiv del_q(). Ca exercițiu, vă 
propunem să realizați implementarea efectivă a acestei clase. 


4.2.2 Clasa heap<T> 


Vom utiliza structura de heap descrisă în Secţiunea 3.4 pentru implementarea unei 
clase definită prin operaţiile de inserare a unei valori şi de extragere a maximului. 
Clasa parametrică heap<T> seamănă foarte mult cu clasele stiva<T> şi 
coada<T>. Diferenţele apar doar la implementarea operaţiilor de inserare în heap 
şi de extragere a maximului. Definiţia clasei heap<T> este: 


+ifndef __HEAP_H 
+define __HEAP_H 


include <iostream.h> 
include <stdlib.h> 
tinclude "tablou.h" 
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template <class T> 
class heap: private tablou<T> { 


public: 
heap( int d ): tablou<T>( d) (h = -1l; } 
heap( const tablou<T>& t ): tablou<T>( t ) 
{ h = t.size( ) - 1; make _heap(); } 
insert ( const Te )4 
delete_max [ T& ); 
protected: 
int tj // indicele ultimului element din heap 


void percolate( int ); 
void sift_down( int ); 
void make _heapl( ); 


); 


template <class T> 

heap<T>::insert ( const Té v ) { 
if (| h >= d= 1 J return 0j 
al ++h ] = v; percolate(h ); 

return 1; 


) 


template <class T> 
heap<T>::delete _max( T& v ) { 

if ( hħh < 0) return 0; 

v= al 0 ]$ 

aili 9 ] =al h= ]ș sift downt 9 Jz 
return 1; 


) 


template <class T> 
void heap<T>::make_heapi( ) { 

for ( ant i = (h + 1) Z 27 i >= 1; sift domni ==i | J} 
) 


template <class T> 
void heap<T>::percolate( int i) { 
T*A=a - 1; //al 0] este A[ i lp eziz 
// a[ i- 1 ] este A[ i ] 
int k= i + l; J} 


do- f 
j = k; 
if {j> 1 NI RI] >A azl ik= 
T tmp AL J l7 AL j ] SALk]; ALk ] = tmp; 


J while | J 15 k Jj 
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template <class T> 
void heap<T>::sift_down( int i) 4 
T*A=a - 1; //al 0] este Al l ly izaj 
// aln- 1 ] este A[ n ] 
int n= +l; k= i + 1; J} 


do { 
J= k} 
if (2%*j < n es al 2%5 1 > ALk ] ) k = 2*3; 
if ( 2*j < n && Al 2*j+1 ] > A[ k ] ) k = 2*j+1; 
Tmp SAPT J7 al 7] ALE JI; ALE] = tmp} 

} while ( j !=k); 

) 

tendi f 


Procedurile insert () şi delete max() au fost adaptate stilului de tratare a 
excepțiilor prezentat în secţiunea precedentă: ele returnează valorile logice true 
sau false, după cum operaţiile respective sunt, sau nu sunt posibile. 


Clasa heap<T> permite crearea unor heap-uri cu elemente de cele mai diverse 
tipuri: int, float, long, char etc. Dar încercarea de a defini un heap pentru un 
tip nou T, definit de utilizator, poate fi respinsă chiar în momentul compilării, 
dacă acest tip nu are definit operatorul de comparare >. Acest operator, a cărui 
definire rămâne în sarcina proiectantului clasei T, trebuie să returneze true (0 
valoare diferită de 0) dacă argumentele sale sunt în relaţia > şi false (adică 0) în 
caz contrar. Pentru a nu fi necesară şi definirea operatorului <, în implementarea 
clasei heap<T> am folosit numai operatorul >. 


Vom exemplifica utilizarea clasei heap<T> cu un operator > diferit de cel 
predefinit prin intermediul clasei intărval. Deşi clasa interval nu are definit 
operatorul >, programul următor “trece” de compilare şi se execută (aparent) 
corect. 


tinclude "intErval.h" 
tinclude "heap.h" 


// dimensiunea heap-ului, margine superioara in intErval 
const SIZE = 128; 


int main( ) { 
heap<intErval> hi( SIZE ); 
interval vi SIZE Jý 
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cout. << “Inserare in heap (^2/#" << (SIZE = 1) << n) ha. 1) 
while ( cin >> v) { 

hi.insert | v )}; 

COE <a Miojo Mi 


) 


cin.cleaei }); 


cout << "Extragere din heap\n"; 
while ( hi.delete_max( yv ) ) cout <<v << '1'; 


return 0; 


Justificarea corectitudinii sintactice a programului de mai sus constă în existența 
operatorului de conversie de la intErval la int. Prin această conversie, 
compilatorul rezolvă compararea a două valori de tip intErval (pentru operatorul 
>), sau a unei valori intErval cu valoarea O (pentru operatorul !=) folosind 
operatorii predefiniţi pentru argumente de tip întreg. Utilizând acelaşi operator de 
conversie de la interval la int, putem defini foarte comod un operator >, prin 
care heap-ul să devină un min-heap. Noul operator > este practic negarea relaţiei 
uzuale >: 


// Operatorul > pentru min-heap 
int operator >( const intErval& a, const intEervale b) [| 
return a < pi 


} 


La compilarea programului de mai sus, probabil că ați observat un mesaj relativ la 
invocarea funcției “non-const” intErval::operator int () pentru un obiect 
const în funcția heap<T>::insert (). lată despre ce este vorba. Următorul 
program generează exact acelaşi mesaj: 


#include "intErval.h" 


int maini ) { 
intErval xl 
const interval ž2( 20, 10 > 


xl = x2} 
return 0; 


Deşi nu este invocat explicit, operatorul de conversie la int este aplicat variabilei 
constante x2. Înainte de a discuta motivul acestei invocări, să ne oprim puțin 
asupra manipulării obiectelor constante. Pentru acest tip de variabile (variabile 
constante!), aşa cum este x2, se invocă doar funcțiile membre declarate explicit 
const, funcții care nu modifică obiectul invocator. O astfel de funcție fiind şi 
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operatorul de conversie intErval::operator int (), va trebui să-i completăm 
definiția din clasa intErval cu atributul const: 


operator int( ) const { return v; ) 


Acelaşi efect îl are şi definirea non-const a obiectului x2, dar scopul nu este de a 
elimina mesajul, ci de a înțelege (şi de a elimina) cauza lui. 


Atribuirea xl = x2 ar trebui rezolvată de operatorul de atribuire generat automat 

de compilator, pentru fiecare clasă. În cazul nostru, acest operator nu se invocă, 

deoarece atribuirea poate fi rezolvată numai prin intermediul funcțiilor membre 

explicit definite: 

e x2 este convertit la int prin operator int( ), conversie care generează şi 
mesajul discutat mai sus 


e Rezultatul conversiei este atribuit lui x1 prin operator =(int). 


Din păcate, rezultatul atribuirii este incorect. În loc ca x2 să fie copiat în x1, va fi 
actualizată doar valoarea v a lui x1 cu valoarea v lui x2. Evident că, în exemplul 
de mai sus, x1 va semnala depăşirea domeniului său. 


Soluția pentru eliminarea acestei aparente anomalii, generate de interferența 
dintre operator int( ) şi operator =(int), constă în definirea explicită a 
operatorului de atribuire pentru obiecte de tip intErval: 


intErval& intErval::operator =( const intErvale s } { 
min = s.min; v = s.V; max = s.max; 
return *this; 


După ce am clarificat particularităţile obiectelor constante, este momentul să 
adaptăm corespunzător şi clasa tablou<T>. Orice clasă frecvent utilizată — şi 
tablou<T> este una din ele — trebuie să fie proiectată cu grijă, astfel încât să 
suporte inclusiv lucrul cu obiecte constante. Vom adăuga în acest scop atributul 
const funcţiei membre size (): 


size( ) const { return d; ) 
In plus, mai adăugăm şi un nou operator de indexare: 


const T& operator []( int ) const; 


Particularitatea acestuia constă doar în tipul valorii returnate, const T&, valoare 
imposibil de modificat. Consistenţa declaraţiei const, asociată operatorului de 
indexare, este dată de către proiectantul clasei şi nu poate fi verificată semantic 
de către compilator. O astfel de declaraţie poate fi ataşată chiar şi operatorului de 
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indexare obișnuit (cel non-const), căci el nu modifică nici una din datele membre 
ale clasei tablou<T>. Ar fi însă absurd, deoarece tabloul se modifică de fapt prin 
modificarea elementelor sale. 


4.3 Clasa lista<E> 


Structurile prezentate până acum sunt de fapt liste implementate secvențial, 
diferenţiate prin particularităţile operaţiilor de inserare şi extragere. În cele ce 
urmează, ne vom concentra asupra unei implementări înlănțuite a listelor, prin 
alocarea dinamică a memoriei. 


Ordinea nodurilor unei liste se realizeză prin completarea informaţiei propriu-zise 
din fiecare nod, cu informații privind localizarea nodului următor şi eventual a 
celui precedent. Informaţiile de localizare, numite legături sau adrese, pot fi, în 
funcţie de modul de implementare ales (vezi Secţiunea 3.1), indici într-un tablou, 
sau adrese de memorie. În cele ce urmează, fiecare nod va fi alocat dinamic prin 
operatorul new, legăturile fiind deci adrese. 


Informaţia din fiecare nod poate fi de orice tip, de la un număr întreg sau real la o 
structură oricât de complexă. De exemplu, pentru reprezentarea unui graf prin 
lista muchiilor, fiecare nod conţine cele două extremități ale muchiei şi lungimea 
(ponderea) ei. Limbajul C++ permite implementarea structurii de nod prin 
intermediul claselor parametrice astfel: 


template <class E> 

class nod 4 

A axi 

E val;  // informatia propriu-zisa 
nod<E> *next; // adresa nodului urmator 


); 


Operaţiile elementare, cum sunt parcurgerile, inserările sau ştergerile, pot fi 
implementate prin intermediul acestei structuri astfel: 


e Parcurgerea nodurilor listei: 


nod<E> *a; // adresa nodului actual 

Fi 

while (a) { // adresa ultimului element are valoarea 0 
A: a prelucrarea informatiei a->val 
a = a->next; // notatie echivalenta cu a = (*a).next 


e Inserarea unui nou nod în listă: 
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nod<E> *a; // adresa nodului dupa care se face inserarea 
nod<E> *pn; // adresa nodului de inserat 

// 

pn->next a->next; 

a=>neăt. = prh} 


e Ştergerea unui nod din listă (operaţie care necesită cunoaşterea nu numai a 
adresei elementului de eliminat, ci şi a celui anterior): 


nod<E> *a; // adresa nodului de sters 
nod<E> *pp; // adresa nodului anterior lui a 
// 

pp->next a->next; // stergerea propriu-zisa 

// 


// eliberarea spatiului de memorie alocat nodului de 
// adresa a, nod tocmai eliminat din lista 


Fi 


Structura de nod este suficientă pentru manipularea listelor cu elemente de tip | 
cu condiţia să cunoaştem primul nod: 


nod<E> head;  // primul nod din lista 


Există totuşi o listă imposibil de tratat prin intermediul acestei implementări, şi 
anume lista vidă. Problema de rezolvat este oarecum paradoxală, deoarece 
variabila head, primul nod din listă, trebuie să reprezinte un nod care nu există. 
Se pot găsi diverse soluţii particulare, dependente de tipul şi natura informaţiilor. 
De exemplu, dacă informaţiile sunt valori pozitive, o valoare negativă ar putea 
reprezenta un nod inexistent. O altă soluţie este adăugarea unei noi date membre 
pentru validarea existenţei nodului curent. Dar este inacceptabil ca pentru un 
singur nod şi pentru o singură situație să încărcăm toate celelalte noduri cu încă 
un câmp. 


Imposibilitatea reprezentării listelor vide nu este rezultatul unei proiectări 
defectuoase a clasei nod<E>, ci al confuziei dintre listă şi nodurile ei. Identificând 
lista cu adresa primului ei nod și adăugând funcţiile uzuale de manipulare 
(inserări, ştergeri etc), obţinem tipul abstract lista<E> cu elemente de tip E: 


template <class E> 
class lista 4 
// 
private: 
nod<E> *head; // adresa primul nod din lista 


); 


Conform principiilor de încapsulare, manipularea obiectelor clasei abstracte 
lista<E> se face exclusiv prin intermediul funcţiilor membre, structura internă a 
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listei şi, desigur, a nodurilor, fiind invizibilă din exterior. Contează doar tipul 
informațiilor din listă şi nimic altceva. lată de ce clasa nod<E> poate fi în 
întregime nepublică: 


template <class E> 
class nod 4 
friend class lista<E>; 


SE aws 

protected: 
nod( const E& v ): val(v ) ( next = 0} } 
E val;  // informatia propriu-zisa 


nod<E> *next; // adresa nodului urmator 
); 
În lipsa declaraţiei friend, obiectele de tip nod<E> nici măcar nu pot fi definite, 
datorită lipsei unui constructor public. Prin declaraţia friend se permite accesul 
clasei lista<E> la toţi membrii privaţi ai clasei nod<E>. Singurul loc în care 
putem utiliza obiectele de tip nod<E> este deci domeniul clasei lista<E>. 


Înainte de a trece la definirea funcţiilor de manipulare a listelor, să remarcăm un 
aspect interesant la constructorul clasei nod<E>. Inițializarea membrului val cu 
argumentul v nu a fost realizată printr-o atribuire val = v, ci invocând 
constructorul clasei E prin lista de inițializare a membrilor: 


nodi const Eé v )i vali) {f Zf oes } 


In acest context, atribuirea este ineficientă, deoarece val ar fi inițializat de două 
ori: o dată în faza de inițializare prin constructorul implicit al clasei E, iar apoi, 
în faza de atribuire, prin invocarea operatorului de atribuire. 


Principalele operații asupra listelor sunt inserarea şi parcurgerea elementelor. 
Pentru a implementa parcurgerea, să ne amintim ce înseamnă parcurgerea unui 
tablou — pur şi simplu un indice şi un operator de indexare: 


tablou<int> T( 32 ); 
TI 31 ] = 14 


În cazul listelor, locul indicelui este luat de elementul curent. Ca şi indicele, care 
nu este memorat în clasa tablou, acest element curent nu are de ce să facă parte 
din structura clasei  lista<T>. Putem avea oricâte elemente curente, 
corespunzătoare oricâtor parcurgeri, tot aşa cum un tablou poate fi adresat prin 
oricâți indici. Analogia tablou-listă se sfârşeşte aici. Locul operatorului de 
indexare [] nu este luat de o funcţie membră, ci de o clasă specială numită 
iterator<E>. 


Într-o variantă minimă, datele membre din clasa iterator<E> sunt: 
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template <class E> 
class iterator { 


// 

private: 
nod<E>* const *phead; 
nod<E> žaj 


); 


adică adresa nodului actual (curent) şi adresa adresei primului element al listei. 
De ce adresa adresei? Pentru ca iteratorul să rămână funcţional şi în situaţia 
eliminării primului element din listă. Operatorul (), numit în terminologia 
specifică limbajului C++ iterator, este cel care implementează efectiv operaţia de 
parcurgere 


template <class E> 

iterator<E>::operator ()(E& v ) { 
if( a) {v = a->val; a = a->next; return 1; } 
else { if( *phead ) a = *phead; return 0; } 


Se observă că parcurgerea este circulară, adică, odată ce elementul actual a ajuns 
la sfârşitul listei, el este inițializat din nou cu primul element, cu condiţia ca lista 
să nu fie vidă. Atingerea sfârşitului listei este marcată prin returnarea valorii 
false. În caz contrar, valoarea returnată este true, iar elementul curent este 
“returnat” prin argumentul de tip referință la E. Pentru exemplificare, operatorul 
de inserare în ostream poate fi implementat prin clasa iterator<E> astfel: 


template <class E> 
ostream& operator <<( ostream& os, const lista<E>& lista ) { 


E yy iterator<E> 1 = listaj 
os << " { ii- 
while | ||) | 03 44 y << l! To 


OS ea ”) ws 


return os; 


Iniţializarea iteratorului 1, realizată prin definiţia iterator<E> 1 = lista, este 
implementată de constructorul 
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template <class E> 

iterator<E>::iterator( const lista<E>s 1) { 
phead = &l.head; 
a = *phead; 


Declaraţia const a argumentului lista<E>& 1 semnifică faptul că 1, împreună cu 
datele membre, este o variabilă read-only (constantă) în acest constructor. În 
consecinţă, *phead trebuie să fie constant, adică definit ca 


nod<E>* const *phead; 


Aceeaşi inițializare mai poate fi realizată şi printr-o instrucțiune de atribuire 
1 = lista, operatorul corespunzător fiind asemănător celui de mai sus: 


template <class E> 

iterator<E>& iterator<E>::operator =( const lista<E>& 1) | 
phead = &l.head; 
a = *phead; 


return *this; 


Pentru a putea defini un iterator neinițializat, se va folosi constructorul implicit 
(fără nici un argument): 


template <class E> 
iterator<E>::iterator( ) { 
phead = 0; 
a = 0; 


In finalul discuţiei despre clasa iterator<E>, vom face o ultimă observație. 
Această clasă trebuie să aibă acces la membrii privaţi din clasele nod<E> şi 
lista<E>, motiv pentru care va fi declarată friend în ambele. 


In sfârşit, putem trece acum la definirea completă a clasei lista<E>. Funcţia 
insert () inserează un nod înaintea primului element al listei. 


template <class E> 

lista<E>& lista<E>::insert( const Es v ) { 
nod<E> *pn = new nod<E>( v ); 
pn->next = head; head = pn; 


return *this; 
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O altă funcţie membră, numită init (), este invocată de către constructorul de 
copiere şi de către operatorul de atribuire, pentru inţializarea unei liste noi cu o 
alta, numită listă sursa. 


template <class E> 


void lListacaoisinit ( const lista<E>6 sursă ) | 
E v; iterator<E> s = sursa; 


for ( nod<E> *tail = head = 0; s( v ); ) í 


nod<E> *pn = new nod<E>( v ); 
if ( !tail ) head = pn; else tail->next pn; 
tail = pn; 


Funcţia reset () elimină rând pe rând toate elementele listei: 


template <class E> 
void lista<E>::reset( ) | 
nod<E> *a = head; 


while(a ) { 
nod<E> *pn = a->next; 
delete a; 
a = pn; 

) 

head = 0; 


Instrucţiunea head = 0 are, aparent, același efect ca întreaga funcție reset (), 
deoarece lista este redusă la lista vidă. Totuşi, această instrucţiune nu se poate 
substitui întregii funcţii, deoarece elementele listei ar rămâne alocate, fără să 
existe posibilitatea de a recupera spaţiul alocat. 


Declaraţiile claselor nod<E>, lista<E> şi iterator<E>, în forma lor completă, 
sunt următoarele: 


template <class E> 

class nod 4 
friend class lista<E>; 
friend class iterator<E>; 


protected: 
nod( const Eé v ): val( v ) { next = 0} } 
E valë  // informatia propriu-zisa 


nod<E> *next; // adresa nodului urmator 
); 
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template <class E> 
class lista 4 
friend class iterator<E>; 


public: 
lista( ) { head = 0; } 
Ilista{ const lista<sE>e s ) | init( s Jy ) 
~lista( ) { reset( ); } 
lista& operator =( const lista<E>& ); 
lista& insert( const E& ); 

private: 


nod<E> *head; // adresa primul nod din lista 


void init{ const lista<E>6 |7 
void reset ( ); 


); 


template <class E> 
class iterator | 
public: 
iterator( ); 
iterator ({ const lista<E>& ); 


operator ()(E& ); 
iterator<E>& operator =( const lista<E>& ); 


>* const *phead; 
> zag 


4.4 Exerciţii 


4.1 In cazul alocării dinamice, este mai rentabil ca memoria să se aloce în 
blocuri mici sau în blocuri mari? 


Soluţie: Rulaţi următorul program. Atenţie, stiva programului trebuie să fie 
suficient de mare pentru a “rezista” apelurilor recursive ale funcţiei 
alocareDinmica (). 


tinclude <iostream.h> 


static int nivel; 
static int raport; 
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void alocareDinamica( unsigned n ) { 
++nivel; 
char *ptr = new charl n |; 
it | pte) 
alocareDinamica( n ); 


// memoria libera este epuizata 
delete ptr; 
if | !raport++ ) 
cout << "InMemoria libera a fost epuizata. " 
<< "S-au alocat T 


<< (long)nivel * n * sizeof( char ) / 1024 << "RI 
<< ".nNumarul de apeluri " << nivel 
<< "; la fiecare apel s-au alocat " 
dă n * siseofi char ) << 1 oceteti, a; 
) 
main( ) { 
for ( unsigned i = 1024; i > 32; i /= 2) 4 
nivel = 1; raport = 0; 
alocareDinamica( 64 * i = 1); 


) 


return 1; 


) 


Rezultatele obţinute sunt clar în favoarea blocurilor mari. Explicaţia constă în 
faptul că fiecărui bloc alocat i se adaugă un antet necesar gestionării zonelor 
ocupate şi a celor libere, zone organizate în două liste înlănţuite. 


4.2 Explicaţi rezultatele programului de mai jos. 


tinclude <iostream.h> 
include "tablou.h" 


int main( ) 4 
tablentint> mi 12 J} 


for | int i= 0, d 
yil I e 27 


yYsize( Jj íi < d; F+ } 


cout << TinTabloul y amope g 
y= 8; 
cout << TinTablouLl y AE E 


pout <% in 
return 0; 


Soluţie: Elementul surprinzător al acestui program este instrucţiunea de atribuire 
y = 8. Surpinzător, în primul rând, deoarece ea “trece” de compilare, deşi nu s-a 
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definit operatorul de atribuire corespunzător. În al doilea rând, instrucţiunea 
y = 8 surprinde prin efectele execuţiei sale: tabloul y are o altă dimensiune şi un 
alt conţinut. Explicaţia este dată de o convenţie a limbajului C++, prin care un 
constructor cu un singur argument este folosit și ca operator de conversie de la 
tipul argumentului, la tipul clasei respective. În cazul nostru, tabloului y i se 
atribuie un tablou temporar de dimensiune 8, generat prin invocarea 
constructorului clasei tablou<T> cu argumentul 8. S-a realizat astfel modificarea 
dimensiunii tabloului y, dar cu preţul pierderii conținutului inițial. 


4.3 Exerciţiul de mai sus conţine o soluție pentru modificarea dimensiunii 
obiectelor de tip tablou<T>. Problema pe care o punem acum este de a rezolva 
problema, astfel încât conţinutul tabloului să nu se mai piardă. 


Soluţie: Iată una din posibilele implementări: 


template< class T > 
tablou<T>& tablou<T>::newsize( int dN J { 
T *aN = Qi // noua adresa 


LE AN > ai i 


aN = new T [ daN |]; // alocarea dinamica a memoriei 
for ( ine 1 > d < dN? dż GNA => ] 
ani i ] =a[ i ]3 // alocarea dinamica a memoriei 

} 
else 

daN = 0; 
delete [ ] a; // eliberarea vechiului spatiu 
d = dN; a = aN; // redimensionarea obiectului 


return *this; 


4.4 Implementați clasa parametrică coada<T>. 


Soluție: Conform celor menționate la sfârşitul Secţiunii 4.2.1, ne vom inspira de 
la structura clasei stiva<T>. Una din implementările posibile este următoarea. 


template <class T> 
class coada: private tablou<T> { 
public: 
coada int d ): tablou<Ir>{ d ) 
( head = tail = 0; } 
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ins_a( const 
del_q( T 


private: 
int head; // 
int tailz // 
{i 
); 


template <class T> 
coada<T>: :iîns_qg( 


const T& x) 


int h = (head + 1) 5 d; 
if ( h == tail ) return 0; 
a[ head = h ] = x; return 1; 


} 


template <class T> 
coada<T>::del_gq( Té x) { 


if ( head == tail ) 
tail = ( tail + 1) % d} 
x = a[ tail ]; 


4.5 
tip int. 


{ 


return 0; 


return 1; 
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indicele ultimei locatii ocupate 


primei 


indicele locatiei predecesoar 
locatii ocupate 


Testaţi funcționarea claselor stiva<T> şi coada<T>, folosind elemente de 


Soluţie: Dacă programul următor furnizează rezultate corecte, atunci putem avea 
certitudinea că cele două clase sunt corect implementate. 


tinclude <iostream.h> 
tinclude "stiva.h" 
tinclude "coada.h" 


void main( ) { 
int ñp 1 = 07 
cout << "Numarul 


stiva<int> st(n 
coada<int> cd( n 


"InStiva 
st .push ( 


cout << 
while ( 


cout << 
while ( 


"\nStiva pop 
st.pop( i) ) 


cout << 


while 4 cd:-iñns a i) ) 


"inCoada ins_qg... 


elementelor 


g< i+t 


g< itt 


cin >> m 


e ta 
Pe A Ti 
Pe Ti 
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cout << T\nCoada del _q... "3 
while ( cd.del _g( i ) ) cout << i A Ta 


ate. << Tim; 


4.6 Testaţi funcționarea clasei parametrice lista<E> cu noduri de tip adrese 
de tablou şi apoi cu noduri de tip tablou<T>. 


Soluţie (incorectă): Programul următor nu funcționează corect decât după ce a 
fost modificat pentru noduri de tip tablou<T>. Pentru a-l corecta, nu uitaţi că 
toate variabilele din ciclul for sunt locale. 


tinclude <iostream.h> 


include "tablou.h" 
tinclude "lista.h” 


typedef tablou<int> *PTI; 


main( ) { 
lista“ PTII> tablist; 


for ( int n = Q; => a 0 Aa de 

{t tabloucint> t£[ + 1j 
for | int J = tesize( J} j==) El J | = f+ )} 
cgut 44 "tablou P << 1 << 1 Te cout ce t <% Pa! 
tablist.insert ( &t ); 

) 


i 
ki 


cout << Tntista Pi cout << tablist << "ins 
PTI t; iterator<PTI> it = tablist; 
while( it(t) ) 

cout << "Tablou din lista" <€< E << "in! 


return 1; 


4.7 Destructorul clasei lista<T> “distruge” nodurile, invocând procedura 
iterativă reset (). Implementaţi un destructor în variantă recursivă. 


Indicaţie: Dacă fiecare element de tip nod<E> are un destructor de forma 
-nod( ) { delete next; ), atunci destructorul clasei lista<E> poate fi 
-lista( ) { delete head; |). 


5. Analiza eficienţei 
algoritmilor 


Vom dezvolta în acest capitol aparatul matematic necesar pentru analiza eficienţei 
algoritmilor, încercând ca această incursiune matematică să nu fie excesiv de 
formală. Apoi, vom arăta, pe baza unor exemple, cum poate fi analizat un 
algoritm. O atenţie specială o vom acorda tehnicilor de analiză a algoritmilor 
recursivi. 


5.1  Notaţia asimptotică 


In Capitolul 1 am dat un înțeles intuitiv situației când un algoritm necesită un 
timp în ordinul unei anumite funcţii. Revenim acum cu o definiţie riguroasă. 


5.1.1 O notație pentru “ordinul lui” 


Fie N mulțimea numerelor naturale (pozitive sau zero) şi R mulţimea numerelor 
y r E RI + x ` N 

reale. Notăm prin N şi R mulțimea numerelor naturale, respectiv reale, strict 

pozitive, şi prin R mulțimea numerelor reale nenegative. Mulțimea (true, false) 


de constante booleene o notăm cu B. Fie f: N—R o funcţie arbitrară. Definim 
mulțimea 


O(f)=U:N>R |(ăceR”) (Ang e N) (Yn 2 no) lin) < cf (n)]) 


Cu alte cuvinte, O( f ) (se citeşte “ordinul lui f ”) este mulțimea tuturor funcțiilor t 
mărginite superior de un multiplu real pozitiv al lui f, pentru valori suficient de 
mari ale argumentului. Vom conveni să spunem că t este în ordinul lui f (sau, 
echivalent, 1 este în O(f), sau te O(f)) chiar şi atunci când valoarea f (n) este 
negativă sau nedefinită pentru anumite valori n < nọ. În mod similar, vom vorbi 
despre ordinul lui f chiar şi atunci când valoarea t(n) este negativă sau nedefinită 
pentru un număr finit de valori ale lui n; în acest caz, vom alege n, suficient de 


mare, astfel încât, pentru n > nọ, acest lucru să nu mai apară. De exemplu, vom 


vorbi despre ordinul lui n/log n, chiar dacă pentru n =0 şi n = 1 funcţia nu este 
definită. În loc de re O(f), uneori este mai convenabil să folosim notația 
t(n) e O(f (n)), subînţelegând aici că t(n) şi f (n) sunt funcţii. 
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Fie un algoritm dat şi fie o funcţie r: N — R“ astfel încât o anumită implementare 
a algoritmului să necesite cel mult t(n) unităţi de timp pentru a rezolva un caz de 
mărime n, n € N. Principiul invarianţei (menţionat în Capitolul 1) ne asigură că 
orice implementare a algoritmului necesită un timp în ordinul lui t. Mai mult, 
acest algoritm necesită un timp în ordinul lui f pentru orice funcţie f: N — R” 
pentru care re O(f). În particular, re O(t). Vom căuta în general să găsim cea 
mai simplă funcţie f, astfel încât re O( f). 


Proprietățile de bază ale lui O(f) sunt date ca exerciţii (Exerciţiile 5.1—5.7) şi 
este recomandabil să le studiaţi înainte de a trece mai departe. 


Notaţia asimptotică defineşte o relaţie de ordine parţială între funcţii şi deci, între 
eficienţa relativă a diferiților algoritmi care rezolvă o anumită problemă. Vom da 
în continuare o interpretare algebrică a notaţiei asimptotice. Pentru oricare două 
funcţii f, g : N — R“, definim următoarea relaţie binară: f < g dacă O( f) c O(g). 
Relaţia “<” este o relație de ordine parțială în mulțimea funcțiilor definite pe N şi 
cu valori în R” (Exercițiul 5.6). Definim și o relație de echivalență: f= g dacă 
O( f) = O(g). 

În mulțimea O(f) putem înlocui pe f cu orice altă funcție echivalentă cu f. De 
exemplu, lg n = ln n = log n şi avem O(lg n) = O(ln n) = O(log n). Notând cu O(1) 
ordinul funcțiilor mărginite superior de o constantă, obținem ierarhia: 


O(1) c O(log n) c O(n) c O(n log n) c O(n?) c Oln’) c o’ 


Această ierarhie corespunde unei clasificări a algoritmilor după un criteriu al 
performanţei. Pentru o problemă dată, dorim mereu să obținem un algoritm 
corespunzător unui ordin cât mai “la stânga”. Astfel, este o mare realizare dacă în 
locul unui algoritm exponențial găsim un algoritm polinomial. 


În Exercițiul 5.7 este dată o metodă de simplificare a calculelor, în care apare 
notația asimptotică. De exemplu, 


n°+3n°+n+8 € O(n°+(3n°+n+8)) = O(max(n?, 3n2+n+8)) = O(n) 


Ultima egalitate este adevărată, chiar dacă max(n’, 3n°+n+8) 2 ns pentru 
O < n < 3, deoarece notația asimptotică se aplică doar pentru n suficient de mare. 
De asemenea, 


n*-3n?-n-8 e O(n*/2+(nî-3n?-n-8)) = O(max(n?/2, n/2—3n?-n-8)) 
= O(n) = O(n’) 


chiar dacă pentru 0 <n < 6 polinomul este negativ. Exerciţiul 5.8 tratează cazul 
unui polinom oarecare. 
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Notaţia O( f ) este folosită pentru a limita superior timpul necesar unui algoritm, 
măsurând eficiența algoritmului respectiv. Uneori este util să estimăm şi o limită 
inferioară a acestui timp. In acest scop, definim mulțimea 


OQ f) = {t: N > R” | Ec e R’) (Ange N) (Yn > n) nn) > cf (n)]} 


Există o anumită dualitate între notațiile O( f) şi Q(f). Şi anume, pentru două 
funcții oarecare f, g : N — R“, avem: fe O(g), dacă şi numai dacă g € Q(f). 
O situație fericită este atunci când timpul de execuție al unui algoritm este limitat, 


atât inferior cât şi superior, de câte un multiplu real pozitiv al aceleiaşi funcții. 
Introducem notația 


O(f)=0(f)N af) 


numită ordinul exact al lui f. Pentru a compara ordinele a două funcţii, notația © 
nu este însă mai puternică decât notația O, în sensul că relația O(f) = O(g) este 
echivalentă cu ©( f ) = 0(g). 


Se poate întâmpla ca timpul de execuţie al unui algoritm să depindă simultan de 
mai mulți parametri. Această situaţie este tipică pentru anumiţi algoritmi care 
operează cu grafuri și în care timpul depinde atât de numărul de vârfuri, cât şi de 
numărul de muchii. Notaţia asimptotică se generalizează în mod natural şi pentru 


funcţii cu mai multe variabile. Astfel, pentru o funcție arbitrară f: N x N > R“ 
definim 
O(f)=U:NxNoR |(ăceR) (Amo, ng e N) (Ym 2 mg) (Yn 2 no) 
[r0m, n) < cf (m, n)]) 


Similar, se obţin şi celelalte generalizări. 


5.1.2  Notaţia asimptotică condiționată 


Mulţi algoritmi sunt mai uşor de analizat dacă considerăm inițial cazuri a căror 
mărime satisface anumite condiţii, de exemplu să fie puteri ale lui 2. In astfel de 


situaţii, folosim notația asimptotică condiționată. Fie f:N — R“ o funcţie 
arbitrară şi fie P : N — B un predicat. 
0(f|P) = t: N> R* | (ace R?) Eno € N) (Yn 2 no) 
[P(n) > t(n) < cf (n)]} 


Notaţia O( f ) este echivalentă cu O( f | P), unde P este predicatul a cărui valoare 
este mereu true. Similar, se obțin notațiile Q( f | P) şi O( f | P). 


92 Analiza eficienţei algoritmilor Capitolul 5 


f x S CEEE 
O funcție f:N >R este eventual nedescrescătoare, dacă există un nọ, astfel 
încât pentru orice n 2 nọ avem f (n) <f (n+1), ceea ce implică prin inducție că, 
pentru orice n > nọ şi orice m 2 n, avem f (n) < f (m). Fie b > 2 un întreg oarecare. 


O funcție eventual nedescrescătoare este b-netedă dacă f (bn) e O(f(n)). Orice 
funcție care este b-netedă pentru un anumit b > 2 este, de asemenea, b-netedă 
pentru orice b > 2 (demonstraţi acest lucru!); din această cauză, vom spune pur şi 
simplu că aceste funcții sunt netede. Următoarea proprietate asamblează aceste 
definiţii, demonstrarea ei fiind lăsată ca exerciţiu. 


Proprietatea 5.1 Fie b > 2 un întreg oarecare, f: N — R” o funcţie netedă şi 
4 ” = A A 
t: N — R o funcţie eventual nedescrescătoare, astfel încât 


t(n) e X(f (n) | n este o putere a lui b) 


unde X poate fi O, Q, sau ©. Atunci, re X(f). Mai mult, dacă re ©( f), atunci şi 
funcţia 7 este netedă. pg 


Pentru a înțelege utilitatea notaţiei asimptotice condiţionate, să presupunem că 
timpul de execuţie al unui algoritm este dat de ecuaţia 


Ge a pentru n=1 
OO do etala) e: eina 


+ $ PONES G ii z = 
unde a,be R sunt constante arbitrare. Este dificil să analizăm direct această 
ecuaţie. Dacă considerăm doar cazurile când n este o putere a lui 2, ecuaţia devine 


45) a pentru n=l 
N) = 
2r(n/2)+ bn pentru n>l o putere a lui 2 


Prin tehnicile pe care le vom învăţa la sfârşitul acestui capitol, ajungem la relaţia 
t(n) e O(n log n | n este o putere a lui 2) 


Pentru a arăta acum că re O(n log n), mai trebuie doar să verificăm dacă t este 
eventual nedescrescătoare și dacă n log n este netedă. 


Prin inducţie, vom demonstra că (Vn > 1) [t(n) < 1(n+1)]. Pentru început, să notăm 
că 


t(1) = a < 2(a+b) = t(2) 

Fie n > 1. Presupunem că pentru orice m < n avem t(m) < t(m+1). În particular, 
t(Ln/2]) < L(n+1)/2)) 
a n/2 < tA n+1)/2)) 
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Atunci, 
t(n) = “n N+ np bn < t(l (n+13/2 + (n+ DP )+b(n+1) = t(n+1) 


In fine, mai rămâne să arătăm că n log n este netedă. Funcția n log n este eventual 
nedescrescătoare și 


2n log(2n) = 2n(log 2 + log n) = (2 log 2)n + 2n logn 
e O(n + n log n) = O(max(n, n log n)) = O(n log n) 


De multe ori, timpul de execuţie al unui algoritm se exprimă sub forma unor 
inegalităţi de forma 


TE t(n) pentru n<no 
905 E entrtiSp 


şi, simultan 


rr) > t(n) pentru n< no 
da t(n /2)+1(n/2)h+dn pentru n > no 


pentru anumite constante c, d e RË, np € N şi pentru două funcții t}, t, : N > R. 
Notaţia asimptotică ne permite să scriem cele două inegalităţi astfel: 


(n) e t(ln/2) + tfn) + O(n) 
respectiv 
in) e “n + tln) + 2 


Aceste două expresii pot fi scrise şi concentrat: 
t(n) € tn) + n2) + On) 
Definim funcţia 


1 pentru n=1 


EE pentru n+ 1 


Am văzut că fe O(n logn). Ne întoarcem acum la funcția t care satisface 
inegalitățile precedente. Prin inducție, se demonstrează că există constantele 
v <d, u > c, astfel încât 


v < t(n)/f (n) <u 
pentru orice n e N*. Deducem atunci 


te O(f) = O(n log n) 
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Această tehnică de rezolvare a inegalităţilor iniţiale are două avantaje. În primul 
rând, nu trebuie să demonstrăm independent că re O(n log n) şi te O(n log n). 
Apoi, mai important, ne permite să restrângem analiza la situaţia când n este o 
putere a lui 2, aplicând apoi Proprietatea 5.1. Deoarece nu ştim dacă 7 este 
eventual nedescrescătoare, nu putem aplica Proprietatea 5.1 direct asupra 
inegalităţilor inițiale. 


5.2 Tehnici de analiză a algoritmilor 


Nu există o formulă generală pentru analiza eficienţei unui algoritm. Este mai 
curând o chestiune de raţionament, intuiție și experiență. Vom arăta, pe baza 
exemplelor, cum se poate efectua o astfel de analiză. 


5.2.1 Sortarea prin selecţie 


Considerăm algoritmul select din Secţiunea 1.3. Timpul pentru o singură execuţie 
a buclei interioare poate fi mărginit superior de o constantă a. În total, pentru un i 
dat, bucla interioară necesită un timp de cel mult b+a(n—i) unităţi, unde b este o 
constantă reprezentând timpul necesar pentru inițializarea buclei. O singură 
execuţie a buclei exterioare are loc în cel mult c+b+a(n-i) unități de timp, unde c 
este o altă constantă. Algoritmul durează în total cel mult 


n—l 
d+ (c+b+a(n-—i)) 


i=l 


unități de timp, d fiind din nou o constantă. Simplificăm această expresie şi 
obținem 


(a/2)n? + (b+c—a/2)n + (d-c-b) 


de unde deducem că algoritmul necesită un timp în O(n”). O analiză similară 


PNR ; Saet x 2 > 
asupra limitei inferioare arată că timpul este de fapt în O(n). Nu este necesar să 
considerăm cazul cel mai nefavorabil sau cazul mediu, deoarece timpul de 
execuţie este independent de ordonarea prealabilă a elementelor de sortat. 


În acest prim exemplu am dat toate detaliile. De obicei, detalii ca iniţializarea 
buclei nu se vor considera explicit. Pentru cele mai multe situaţii, este suficient să 
alegem ca barometru o anumită instrucţiune din algoritm şi să numărăm de câte 
ori se execută această instrucţiune. În cazul nostru, putem alege ca barometru 
testul din bucla interioară, acest test executându-se de n(n-1)/2 ori. Exerciţiul 
5.23 ne sugerează că astfel de simplificări trebuie făcute cu discernământ. 
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5.2.2 Sortarea prin inserţie 


Timpul pentru algoritmul insert (Secţiunea 1.3) este dependent de ordonarea 
prealabilă a elementelor de sortat. Vom folosi comparaţia “x<T7[j]” ca 
barometru. 


Să presupunem că i este fixat şi fie x = T[i], ca în algoritm. Cel mai nefavorabil 
caz apare atunci când x < T[ j] pentru fiecare j între 1 şi i-l, algoritmul făcând în 
această situaţie i-l comparații. Acest lucru se întâmplă pentru fiecare valoare a 
lui i de la 2 la n, atunci când tabloul T este iniţial ordonat descrescător. Numărul 
total de comparații pentru cazul cel mai nefavorabil este 


Y(6-D=nn-9r2e (n?) 
l 


Vom estima acum timpul mediu necesar pentru un caz oarecare. Presupunem că 
elementele tabloului T sunt distincte şi că orice permutare a lor are aceeași 
probabilitate de apariție. Atunci, dacă 1 < k < i, probabilitatea ca T[i] să fie cel 
de-al k-lea cel mai mare element dintre elementele T[1], T[2], ..., T[i] este 1/i. 
Pentru un i fixat, condiția T[i] < T[i—1] este falsă cu probabilitatea 1/i, deci 
probabilitatea ca să se execute comparația “x < T[ j]”, o singură dată înainte de 
ieşirea din bucla while, este 1/i. Comparația “x < T[ j]” se execută de exact două 
ori tot cu probabilitatea 1/i etc. Probabilitatea ca să se execute comparația de 
exact i—1 ori este 2/i, deoarece aceasta se întâmplă atât când x < T[1], cât şi când 
T[1] < x < T[2]. Pentru un i fixat, numărul mediu de comparații este 


c= 1-1/i + 2-1/i +...+ (i-2)-1/i + (i—1)-2/i = (i+1)/2 = Vi 


n 
Pentru a sorta n elemente, avem nevoie de Èc comparații, ceea ce este egal cu 
i=2 


(n*+3n)/4 — H, e 9(n”) 


n 
unde prin H=) ie O(log n) am notat al n-lea element al seriei armonice 
i=l 


(Exerciţiul 5.17). 


Se observă că algoritmul insert efectuează pentru cazul mediu de două ori mai 
puţine comparații decât pentru cazul cel mai nefavorabil. Totuşi, în ambele 


: si 3 3, A 2 
situații, numărul comparaţiilor este în 0(n'). 


Algoritmul necesită un timp în O(n?), atât pentru cazul mediu, cât şi pentru cel 
mai nefavorabil. Cu toate acestea, pentru cazul cel mai favorabil, când inițial 
tabloul este ordonat crescător, timpul este în O(n). De fapt, în acest caz, timpul 
este şi în O(n), deci este în O(n). 
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5.2.3  Heapsort 


Vom analiza, pentru început, algoritmul make-heap din Secţiunea 3.4. Definim ca 
barometru instrucțiunile din bucla repeat a algoritmului sift-down. Fie m numărul 
maxim de repetări al acestei bucle, cauzat de apelul lui sift-down(T, i), unde i este 


cc 


fixat. Notăm cu j, valoarea lui j după ce se execută atribuirea “j — k” la a t-a 
repetare a buclei. Evident, j, =i. Dacă 1 < rs m, la sfârșitul celei de-a (4-l)-a 
repetări a buclei, avem jzk şi k> 2]. În general, Î, > dis, pentru l< tm. 
Atunci, 


$ 5 m-l. 
n jm? 2jm-1 Z 4jm-2 Z -Z2 l 


Rezultă 2”! < n/i, iar de aici obținem relația m < 1 + Ig(n/i). 


Numărul total de executări ale buclei repeat la formarea unui heap este mărginit 
superior de 


a 


Y(+1g(n/î)), unde a = |n/2] =) 


i=1 


Pentru a simplifica această expresie, să observăm că pentru orice k 2 0 


igni) < 2* lg(n/2*), unde b = 2% şi c =2'"-1 
i=b 


Descompunem expresia (*) în secțiuni corespunzătoare puterilor lui 2 şi notăm 
d = Llg(n/2)] : 


a d 
S1g(n/i) < $24 1g(n/2%) < 2% 1g(n/2%) 
i=l k=0 


Demonstrația ultimei inegalităţi rezultă din Exerciţiul 5.26. Dar d = [1g(n/2)] 
implică d+1 < lg n şi d-l > lg(n/8). Deci, 


$ lg(n/i) < 3n 
i=l 


Din (*) deducem că |n/2 |+3n repetări ale buclei repeat sunt suficiente pentru a 
construi un heap, deci make-heap necesită un timp te O(n). Pe de altă parte, 
deoarece orice algoritm pentru formarea unui heap trebuie să utilizeze fiecare 
element din tablou cel puţin o dată, re O(n). Deci, re O(n). Puteţi compara acest 
timp cu timpul necesar algoritmului slow-make-heap (Exerciţiul 5.28). 


Pentru cel mai nefavorabil caz, sift-down(T[1 .. i—1], 1) necesită un timp în 
O(log n) (Exerciţiul 5.27). Ţinând cont şi de faptul că algoritmul make-heap este 


Secţiunea 5.2 Tehnici de analiză a algoritmilor 97 


liniar, rezultă că timpul pentru algoritmul heapsort pentru cazul cel mai 
nefavorabil este în O(n log n). Mai mult, timpul de execuţie pentru heapsort este 
de fapt în O(n log n), atât pentru cazul cel mai nefavorabil, cât şi pentru cazul 
mediu. 


Algoritmii de sortare prezentați până acum au o caracteristică comună: se bazează 
numai pe comparații între elementele tabloului T. Din această cauză, îi vom numi 
algoritmi de sortare prin comparaţie. Vom cunoaşte și alți algoritmi de acest tip: 
bubblesort, quicksort, mergesort. Să observăm că, pentru cel mai nefavorabil caz, 
orice algoritm de sortare prin comparaţie necesită un timp în Q(n logn) 
(Exerciţiul 5.30). Pentru cel mai nefavorabil caz, algoritmul heapsort este deci 
optim (în limitele unei constante multiplicative). Același lucru se întâmplă şi cu 
mergesort. 


5.2.4 Turnurile din Hanoi 


Matematicianul francez Eduard Lucas a propus în 1883 o problemă care a devenit 
apoi celebră, mai ales datorită faptului că a prezentat-o sub forma unei legende. 
Se spune că Brahma a fixat pe Pământ trei tije de diamant şi pe una din ele a pus 
în ordine crescătoare 64 de discuri de aur de dimensiuni diferite, astfel încât 
discul cel mai mare era jos. Brahma a creat şi o mânăstire, iar sarcina călugărilor 
era să mute toate discurile pe o altă tijă. Singura operaţiune permisă era mutarea a 
câte unui singur disc de pe o tijă pe alta, astfel încât niciodată să nu se pună un 
disc mai mare peste unul mai mic. Legenda spune că sfârşitul lumii va fi atunci 
când călugării vor săvârşi lucrarea. Aceasta se dovedeşte a fi o previziune extrem 
de optimistă asupra sfârșitului lumii. Presupunând că în fiecare secundă se mută 
un disc şi lucrând fără întrerupere, cele 64 de discuri nu pot fi mutate nici în 500 
de miliarde de ani de la începutul acţiunii! 


Observăm că pentru a muta cele mai mici n discuri de pe tija i pe tija j (unde 
1<i<3,1<j<3,i+j,n2 1), transferăm cele mai mici n—1 discuri de pe tija i 
pe tija 6—i-j, apoi transferăm discul n de pe tija i pe tija j, iar apoi retransferăm 
cele n-—l discuri de pe tija 6—i-j pe tija j. Cu alte cuvinte, reducem problema 
mutării a n discuri la problema mutării a n—1 discuri. Următoarea procedură 
descrie acest algoritm recursiv. 


procedure Hanoi(n, i, j) 
{mută cele mai mici n discuri de pe tija i pe tija j} 
ifn > Othen  Hanoi(n-I, i, 6—i—j) 
write i “—>“ j 
Hanoi(n-l, 6-i-j, j) 


Pentru rezolvarea problemei inițiale, facem apelul Hanoi(64, 1, 2). 
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Considerăm instrucţiunea write ca barometru. Timpul necesar algoritmului este 
exprimat prin următoarea recurenţă: 


1 pentru n=1 
t(n)= 
2t(n—1)+1 pentru n>l 


Vom demonstra în Secţiunea 5.2 că t(n) = 2"—1. Rezultă re ©(2”). 


Acest algoritm este optim, în sensul că este imposibil să mutăm n discuri de pe o 


tijă pe alta cu mai puțin de 2”—1 operații. Implementarea în oricare limbaj de 
programare care admite exprimarea recursivă se poate face aproape în mod direct. 


5.3 Analiza algoritmilor recursivi 


Am văzut în exemplul precedent cât de puternică şi, în acelaşi timp, cât de 
elegantă este recursivitatea în elaborarea unui algoritm. Nu vom face o 
introducere în recursivitate şi nici o prezentare a metodelor de eliminare a ei. Cel 
mai important câştig al exprimării recursive este faptul că ea este naturală și 
compactă, fără să ascundă esența algoritmului prin detaliile de implementare. Pe 
de altă parte, apelurile recursive trebuie folosite cu discernământ, deoarece 
solicită şi ele resursele calculatorului (timp şi memorie). Analiza unui algoritm 
recursiv implică rezolvarea unui sistem de recurențe. Vom vedea în continuare 
cum pot fi rezolvate astfel de recurențe. Începem cu tehnica cea mai banală. 


5.3.1 Metoda iteraţiei 


Cu puţină experienţă şi intuiție, putem rezolva de multe ori astfel de recurențe 
prin metoda iteraţiei: se execută primii paşi, se intuieşte forma generală, iar apoi 
se demonstrează prin inducție matematică că forma este corectă. Să considerăm de 
exemplu recurenţa problemei turnurilor din Hanoi. Pentru un anumit n> 1 
obținem succesiv 


n—2 
(n) = 2(n-1) + 1 = 22Hn—2) +2 +1 =.. = 2) + zi 
i=0 


Rezultă t(n) = 2"—1. Prin inducție matematică se demonstrează acum cu uşurinţă 
că această formă generală este corectă. 
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5.3.2  Inducţia constructivă 


Inducţia matematică este folosită de obicei ca tehnică de demonstrare a unei 
aserţiuni deja enunțate. Vom vedea în această secţiune că inducția matematică 
poate fi utilizată cu succes şi în descoperirea enunţțului aserțiunii. Aplicând 
această tehnică, putem simultan să demonstrăm o aserţiune doar parțial specificată 
şi să descoperim specificaţiile care lipsesc şi datorită cărora aserţiunea este 
corectă. Vom vedea că această tehnică a inducției constructive este utilă pentru 
rezolvarea anumitor recurențe care apar în contextul analizei algoritmilor. 
Începem cu un exemplu. 


Fie funcția f: N —> N, definită prin recurența 


pentru n=0 


0 
= N pentru n>0 


Să presupunem pentru moment că nu ştim că f (n) = n(n+1)/2 şi să căutăm o astfel 
de formulă. Avem 


n 


SSES r 


i=0 i=0 


şi deci, f(n)e O(n”). Aceasta ne sugerează să formulăm ipoteza inducției 
specificate parțial IISP(n) contorm căreia f este de forma f(n) = an?+bn+c. 
Această ipoteză este parţială, în sensul că a, b şi c nu sunt încă cunoscute. 
Tehnica inducției constructive constă în a demonstra prin inducţie matematică 
această ipoteză incompletă şi a determina în același timp valorile constantelor 
necunoscute a, b şi c. 


Presupunem că JISP(n-1) este adevărată pentru un anumit n > 1. Atunci, 
f(n) = a(n-1)+b(n-1)+c+n = an°+(1+b-2a)n+(a-b+c) 


Dacă dorim să arătăm că ISP(n) este adevărată, trebuie să arătăm că 
f(n)= an2+bn+c. Prin identificarea coeficienţilor puterilor lui n, obținem 
ecuațiile 1+b-2a = b şi a—b+c = c, cu soluția a = b = 1/2, c putând fi oarecare. 
Avem acum o ipoteză mai completă, pe care o numim tot IJ/SP(n): 
f(n)= n/2+n/2+c. Am arătat că, dacă JISP(n-—1) este adevărată pentru un anumit 
n > 1l, atunci este adevărată şi JISP(n). Rămâne să arătăm că este adevărată şi 
IISP(0). Trebuie să arătăm că f (0) = a:0+b-0+c = c. Știm că f (0) = 0, deci ZISP(0) 
este adevărată pentru c=0. În concluzie, am demonstrat că f(n) = n°l2+n12 
pentru orice n. 
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5.3.3  Recurenţe liniare omogene 


Există, din fericire, şi tehnici care pot fi folosite aproape automat pentru a rezolva 
anumite clase de recurenţe. Vom începe prin a considera ecuaţii recurente liniare 
omogene, adică de forma 


= * 
Gotp t Gita t F ta > 0 (£) 
unde f, sunt valorile pe care le căutăm, iar coeficienţii a, sunt constante. 


Conform intuiției, vom căuta soluţii de forma 


unde x este o constantă (deocamdată necunoscută). Încercăm această soluţie în (*) 
şi obținem 


-1 


n n n—k 
ax +aX +..+ax =0 


Soluțiile acestei ecuații sunt fie soluția trivială x = 0, care nu ne interesează, fie 
soluţiile ecuației 


k k-1 
aX = aX 


+... +a,=0 
care este ecuația caracteristică a recurentei (*). 


Presupunând deocamdată că cele k rădăcini r}, f», ..., rą ale acestei ecuații 
caracteristice sunt distincte, orice combinație liniară 


k 
nS n 
tn D=) DA cih 
i=l 


este o soluţie a recurenţei (*), unde constantele c,, cp, ..., C, sunt determinate de 
condiţiile iniţiale. Este remarcabil că (*) are numai soluţii de această formă. 


Să exemplificăm prin recurența care defineşte şirul lui Fibonacci (din Secţiunea 
1.6.4): 
E E AER E ANEI n > 2 


n 


iar tọ = 0, t; = 1. Putem să rescriem această recurenţă sub forma 
La In E. In = 0 


care are ecuaţia caracteristică 


x —x—1=0 
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cu rădăcinile r}, = (1 +45 )/2. Soluția generală are forma 
ti =q +on 


Impunând condiţiile inițiale, obţinem 


cit Co = 0 n=0 
FC tr =l n=1 
de unde determinăm 
cp UNS 


Deci, t, =1/ J50 -7r ). Observăm că r; =0=(1 +5 )/2, r, = -07 şi obținem 


t, =1/ 45 ("0") 


care este cunoscuta relație a lui de Moivre, descoperită la începutul secolului 
XVI. Nu prezintă nici o dificultate să arătăm acum că timpul pentru algoritmul 


fibl (din Secțiunea 1.6.4) este în 0(9”). 


Ce facem însă atunci când rădăcinile ecuației caracteristice nu sunt distincte? Se 


poate arăta că, dacă r este o rădăcină de multiplicitate m a ecuației caracteristice, 


A 2 21 A ; 
atunci t, =r", t, = nr", t, = nfr", ..., t, =n" r" sunt soluții pentru (*). Soluția 


generală pentru o astfel de recurenţă este atunci o combinație liniară a acestor 


termeni şi a termenilor proveniți de la celelalte rădăcini ale ecuației caracteristice. 
Din nou, sunt de determinat exact k constante din condiţiile inițiale. 


Vom da din nou un exemplu. Fie recurența 
ta = Sta 8t, + 4-a n>3 


iar tọ = 0, t4 = 1, t, = 2. Ecuația caracteristică are rădăcinile 1 (de multiplicitate 1) 
şi 2 (de multiplicitate 2). Soluţia generală este: 


> cl" + c,2" + can2" 


Din condiţiile iniţiale, obţinem c, = —2, c, = 2, c} = —1/2. 


5.3.4  Recurențţe liniare neomogene 


Considerăm acum recurenţe de următoarea formă mai generală 
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n 
ag, t aita +- + Ata > b pn) (**) 


unde b este o constantă, iar p(n) este un polinom în n de grad d. Ideea generală 
este ca, prin manipulări convenabile, să reducem un astfel de caz la o formă 
omogenă. 


De exemplu, o astfel de recurenţă poate fi: 


n 
ta T 2-1 =3 


În acest caz, b =3 şi p(n) = 1, un polinom de grad 0. O simplă manipulare ne 
permite să reducem acest exemplu la forma (*). Inmulţim recurența cu 3, obținând 


n+1 
3t, 6t, 1 =3 
Înlocuind pe n cu n+1 în recurența inițială, avem 
n+1 
În a 2t, =3 
În fine, scădem aceste două ecuații 
fut O 5t, + 6t, =0 


Am obținut o recurenţă omogenă pe care o putem rezolva ca în secțiunea 
precedentă. Ecuația caracteristică este: 


x- 5x+6=0 
adică (x—2)(u—3) = 0. 


Intuitiv, observăm că factorul (x—2) corespunde părţii stângi a recurentei inițiale, 
în timp ce factorul (x—3) a apărut ca rezultat al manipulărilor efectuate, pentru a 
scăpa de parte dreaptă. 


Generalizând acest procedeu, se poate arăta că, pentru a rezolva (**), este 
suficient să luăm următoarea ecuație caracteristică: 
k k-1 d+1 
(apă +ax +... +ap(x-b) =0 


Odată ce s-a obținut această ecuație, se procedează ca în cazul omogen. 


Vom rezolva acum recurența corespunzătoare problemei turnurilor din Hanoi: 
ta = tm t1 n21 
iar tọ = 0. Rescriem recurența astfel 


ta Fi 2-1 =1 
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care este de forma (**) cu b=1 şi p(n) = 1, un polinom de grad 0. Ecuația 
caracteristică este atunci (x—2)(x—1) = 0, cu soluțiile 1 şi 2. Soluţia generală a 
recurenţei este: 


n n 
1, >Cyl +c92 
Avem nevoie de două condiţii iniţiale. Ştim că tọ = 0; pentru a găsi cea de-a doua 
condiție calculăm 
ti = 2t9+l 


Din condiţiile iniţiale, obţinem 


Dacă ne interesează doar ordinul lui 7, nu este necesar să calculăm efectiv 
constantele în soluţia generală. Dacă ştim că t, = cj" + c2", rezultă t, € 0(2”). 
Din faptul că numărul de mutări a unor discuri nu poate fi negativ sau constant, 
deoarece avem în mod evident t, 2 n, deducem că c, > 0. Avem atunci t, € Q(2”) 


şi deci, t, € 9(2”). Putem obţine chiar ceva mai mult. Substituind soluţia generală 
înapoi în recurența iniţială, găsim 


1 =t, — 2043 cp + 632" — 2(c, + 6,2") = e, 


Indiferent de condiţia iniţială, c} este deci —l. 


5.3.5 Schimbarea variabilei 


Uneori, printr-o schimbare de variabilă, putem rezolva recurențe mult mai 
complicate. In exemplele care urmează, vom nota cu T(n) termenul general al 
recurenţei şi cu 7, termenul noii recurenţe obţinute printr-o schimbare de 


variabilă. Presupunem pentru început că n este o putere a lui 2. 


Un prim exemplu este recurența 
T(n) = 4T(n/2) + n n>l 
în care înlocuim pe n cu I notăm ź, = T25) = T(n) şi obținem 
t, = 4t, 1+2 
Ecuația caracteristică a acestei recurente liniare este 


(x—4)(a—2) = 0 
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şi deci, t, = c4" + ca. Înlocuim la loc pe k cu lg n 
T(n) = cun? + con 
Rezultă 


T(n) e O(n? | n este o putere a lui 2) 


Un al doilea exemplu îl reprezintă ecuația 
T(n) = 4T(n/2) + n? n>1 
Procedând la fel, ajungem la recurența 
t, = 4t, 1 +4 
cu ecuația caracteristică 
(x-4) =0 
şi soluția generală 7, = c4 + c,k4’. Atunci, 
T(n) = cn? + c,n’lg n 
şi obținem 


T(n) e O(n7log n | n este o putere a lui 2) 


În fine, să considerăm şi exemplul 
T(n) = 3T(n/2) + cn n>l 
c fiind o constantă. Obţinem succesiv 
T(25) ca i (0 n + c24 
t, = 3t, + c2" 
cu ecuația caracteristică 
(x—3)(x—2)= 0 
t, = c3" + c,2* 
T(n) = e 315% + con 
şi, deoarece 


lg b l 
a8’ = pie 
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obținem 
lg 3 
T(n) = cun SPIP con 
deci, 


T(n) e O(n? | n este o putere a lui 2) 


În toate aceste exemple am folosit notația asimptotică condiţionată. Pentru a arăta 
că rezultatele obţinute sunt adevărate pentru orice n, este suficient să adăugăm 
condiţia ca T(n) să fie eventual nedescrescătoare. Aceasta, datorită Proprietății 


5.1 şi a faptului că funcțiile n’, n log n şi n? sunt netede. 


Putem enunța acum o proprietate care este utilă ca reţetă pentru analiza 
algoritmilor cu  recursivităţi de forma celor din exemplele precedente. 
Proprietatea, a cărei demonstrare o lăsăm ca exerciţiu, ne va fi foarte utilă la 
analiza algoritmilor divide et impera din Capitolul 7. 


Proprietatea 5.2 Fie 7: N — R* o funcţie eventual nedescrescătoare 
T(n) = aT(n/b) + cnă n > ng 


unde: no > 1, b>2 şi k 20 sunt întregi; a şi c sunt numere reale pozitive; n/ng 
este o putere a lui b. Atunci avem 


O(n“) pentru a <bk 
T(n) e O(n“ logn) pentru a =pk 
O(n) pentru a >bk 
E 
5.4 Exercitii 
5.1 Care din următoarele afirmații sunt adevărate? 


i) ne On’) 

ii) n?e O(n?) 

iii) 251 e O2” 

iv) (n+1)! e O(n!) 

v) pentru orice funcție f : N => R“, fe O(n) > [f° € O(n®] 
vi) pentru orice funcție f : N => R“, fe O(n) > [2e O02] 
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5.2 Presupunând că f este strict pozitivă pe N, demonstrați că definiția lui 
O( f ) este echivalentă cu următoarea definiție: 


OCS) = {t: N > R| (Ec € R5 (Yn € N) [Kn < cf(n)]) 


5.3 Demonstrați că relația “e O” este tranzitivă: dacă fe O(g) şi g e O(h), 
atunci fe O(h). Deduceţi de aici că dacă g e O(h), atunci O(g) c O(h). 


5.4 Pentru oricare două funcţii f, g : N —> R, demonstraţi că: 


i)  O(f)= O(g) o feol) şi ge O(J) 
ii) O(f)cO(g) o feol) şi geoff) 


5.5 Găsiţi două funcții f, g : N —> R“, astfel încât f Olg) şigg O(f). 


l+sin n 
n 


Indicație: f (n) =n, g(n) = 


5.6 Pentru oricare două funcții f, g: N-— R” definim următoarea relație 
binară: f< g dacă O(f)c O(g). Demonstrați că relația “<” este o relație de 
ordine parțială în mulțimea funcțiilor definite pe N şi cu valori în R. 


Indicaţie: Trebuie arătat că relaţia este parţială, reflexivă, tranzitivă şi 
antisimetrică. Ţineţi cont de Exerciţiul 5.5. 


5.7 Pentru oricare două funcţii f, g : N —> R“ demonstrați că 


O( f+ 8) = O(max( f, 8)) 


unde suma și maximul se iau punctual. 


5.8 Fie f (n) = a„n™+...+a;n + ag un polinom de grad m, cu a„ > 0. Arătați că 
fe Oln”). 


5.9 O(n?) = O(n*+(n?-n%)) = O(max(n?, n2-n5)) = O(n’) 


Unde este eroarea? 


5.10 Găsiţi eroarea în următorul lanț de relații: 
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Şi=1+2+...+n € O(1+2+...+n) = O(max(1, 2, ..., n)) = O(n) 


i=l 


5.11 Fie f, g : N > R*. Demonstrați că: 
i) lim f(n)/g(n) €e R? > O(f)=0(8) 


— o0 


ii) lim f(n)/g(n)=0 => O(f)cole) 


— o0 


Observaţie: Implicațiile inverse nu sunt în general adevărate, deoarece se poate 
întâmpla ca limitele să nu existe. 


5.12 Folosind regula lui l’ Hôspital şi Exerciţiile 5.4, 5.11, arătați că 
logn € O(n ), dar În ¢ O(log n) 


Indicaţie: Prelungim domeniile funcțiilor pe R', pe care sunt derivabile şi 


aplicăm regula lui l'H6spital pentru log ni n. 


5.13 Pentru oricare f, g : N —> R’, demonstrați că: 


fe O(g) o gelf) 


5.14 Arătaţică fe O(g) dacă şi numai dacă 


(dc, de R’) (Ang € N) (Yn > no) [cg(n) < f (n) < dg(n)] 


5.15  Demonstrați că următoarele propoziții sunt echivalente, pentru oricare 
două funcții f, g : N > R”. 

i) O(f)= O(g) 

ii) O(f) = O(g) 

iii) fe O(g) 


5.16 Continuând Exerciţiul 5.11, arătați că pentru oricare două funcţii 
f.g: NR! avem: 
i) lim f(n)/g(n)e Rt > fe@(g) 


— o0 


ii) lim f(n) /g(n) =0 = fe O(g) dar fe Olg) 


n=% 
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iii) lim f(n) /g(n) =+ > fe Q(g) dar fe Olg) 


—o 


5.17 Demonstraţi următoarele afirmaţii: 


i) logne O(log,n) pentru oricare a, b > 1 


ii) Si e ©(n™*') pentru oricare ke N 


i=l 
iii) XI e O(logn) 
i=l 


iv) logn!e O(n log n) 
Indicaţie: La punctul iii) se ține cont de relația: 


Yi =lnn+y+ ln = 1/120 +... 


i=1 
unde y = 0,5772... este constanta lui Euler. 


La punctul iv), din n! < n”, rezultă log n!e O(n log n). Să arătăm acum, că 
log n! e O(n log n). Pentru 0 < i <n-l este adevărată relația 


(n—i)(i+1) 2n 
Deoarece 
(nD? = (n1) ((n-1):2) ((n-2):3)-...-(2-(n-1)) (1n) 2 n” 
rezultă 2 log n! > n log n şi deci log n! e€ O(n log n). 
Punctul iv) se poate demonstra şi altfel, considerând aproximarea lui Stirling: 
n!e jj2zn (n/e)"(1+00/n)) 


unde e = 1,71828.... 


5.18 Arătaţi că timpul de execuţie al unui algoritm este în O(g), g : N > R, 
dacă şi numai dacă: timpul este în O(g) pentru cazul cel mai nefavorabil şi în O(g) 
pentru cazul cel mai favorabil. 


5.19 Pentru oricare două funcţii f, g : N —> R“ demonstrați că 


O(f)+ Olg) = O(f+ g) = O(max(f, 8)) = max(©( f ), ©(8)) 


unde suma și maximul se iau punctual. 
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5.20 Demonstraţi Proprietatea 5.1. Arătaţi pe baza unor contraexemple că cele 
două condiţii “t(n) este eventual nedescrescătoare” şi “f (bn) e O(f(n))” sunt 
necesare. 


5.21 Analizaţi eficienţa următorilor patru algoritmi: 


for i — 1 ton do for i — 1 ton do 
for j —1 to 5 do for j — 1 to i+1 do 
{operație elementară) {operație elementară) 
for i — 1 ton do for i — 1 ton do 
for j — 1 to 6 do for j — 1 to i do 
for k 1 to n do for k — 1 to n do 
{operație elementară} {operație elementară} 


5.22  Construiți un algoritm cu timpul în O(n log n). 


5.23 Fie următorul algoritm 


ke0 
for i — 1 ton do 
for j — 1 to T[i] do 
k < k+T[ j] 


unde T este un tablou de n întregi nenegativi. În ce ordin este timpul de execuție 
al algoritmului? 


Soluție: Fie s suma elementelor lui T. Dacă alegem ca barometru instrucțiunea 
“k — k+T[j]”, calculăm că ea se execută de s ori. Deci, am putea deduce că 
timpul este în ordinul exact al lui s. Un exemplu simplu ne va convinge că am 
greşit. Presupunem că T[i] = 1, atunci când i este un pătrat perfect, şi T[i] = 0, în 
rest. În acest caz, s = Lva]. Totuşi, algoritmul necesită timp în ordinul lui Q(n), 
deoarece fiecare element al lui T este considerat cel puțin o dată. Nu am ţinut cont 
de următoarea regulă simplă: putem neglija timpul necesar inițializării şi 
controlului unei bucle, dar cu condiția să includem “ceva” de fiecare dată când se 
execută bucla. 


Iată acum analiza detailată a algoritmului. Fie a timpul necesar pentru o executare 
a buclei interioare, inclusiv partea de control. Executarea completă a buclei 
interioare, pentru un i dat, necesită b+aT[i] unități de timp, unde constanta b 
reprezintă timpul pentru inițializarea buclei. Acest timp nu este zero, când 
T[i] = 0. Timpul pentru o executare a buclei exterioare este c+b+aT[i], c fiind o 
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n 
nouă constantă. În fine, întregul algoritm necesită d+ Xu(e+b+aTli]) unități de 
i=1 
timp, unde d este o altă constantă. Simplificând, obținem (c+b)n+as+d. Timpul 
t(n, s) depinde deci de doi parametri independenți n şi s. Avem: re O(n+s) sau, 
ținând cont de Exerciţiul 5.19, re O(max(n, s)). 


5.24 Pentru un tablou T[1 .. n], fie următorul algoritm de sortare: 


for i — n downto 1 do 
for j — 2 to i do 
if T[ j-1] > T[ j] then interschimbă T[ j-1] şi T[ j] 
Această tehnică de sortare se numeşte metoda bulelor (bubble sort). 


i)  Analizaţi eficiența algoritmului, luând ca barometru testul din bucla 
interioară. 


ii) Modificaţi algoritmul, astfel încât, dacă pentru un anumit i nu are loc nici o 
interschimbare, atunci algoritmul se oprește. Analizaţi eficiența noului 
algoritm. 


5.25 Fie următorul algoritm 
for i e 0 to n do 
jei 
while j + 0 do j + j div 2 


Găsiți ordinul exact al timpului de execuție. 


5.26  Demonstrați că pentru oricare întregi pozitivi n şi d 
d 
5-2" 1g(n/2*) = 2% 18(n/2%1)-2-1gn 
k=0 

Soluţie: 
d d 
5-2" 1(n/2*) = (2% —Dlgn -X 2" k) 
k=0 k=0 

Mai rămâne să arătați că 


d 
(2%) = (d 02% +2 
k=0 
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5.27 Analizaţi algoritmii percolate şi sift-down pentru cel mai nefavorabil caz, 
presupunând că operează asupra unui heap cu n elemente. 


Indicaţie: În cazul cel mai nefavorabil, algoritmii percolate şi sift-down necesită 
un timp în ordinul exact al înălțimii arborelui complet care reprezintă heap-ul, 
adică în O(g nl) = O(log n). 


5.28 Analizaţi algoritmul slow-make-heap pentru cel mai nefavorabil caz. 


Soluţie: Pentru slow-make-heap, cazul cel mai nefavorabil este atunci când, 
iniţial, T este ordonat crescător. La pasul i, se apelează percolate(T[1 .. i], i), care 
efectuează Lig il comparații între elemente ale lui T. Numărul total de comparații 
este atunci 


C(n) < (n-1) Lig n] e O(n log n) 


Pe de altă parte, avem 


C(n) = X Lig il> ȘI Agi- 1)=1gn!-— (n-1) 


i=2 i=2 


În Exercițiul 5.17 am arătat că lg n! e Q(n log n). Rezultă C(n) e O(n log n) şi 
timpul este deci în O(n log n). 


5.29  Arătaţi că, pentru cel mai nefavorabil caz, timpul de execuţie al 
algoritmului heapsort este şi în Q(n log n), deci în O(n log n). 


5.30 Demonstraţi că, pentru cel mai nefavorabil caz, orice algoritm de sortare 
prin comparaţie necesită un timp în O(n log n). In particular, obţinem astfel, pe 
altă cale, rezultatul din Exerciţiul 5.29. 


Soluţie: Orice sortare prin comparaţie poate fi interpretată ca o parcurgere a unui 
arbore binar de decizie, prin care se stabilește ordinea relativă a elementelor de 
sortat. Într-un arbore binar de decizie, fiecare vârf neterminal semnifică o 
comparaţie între două elemente ale tabloului 7 şi fiecare vârf terminal reprezintă o 
permutare a elementelor lui T. Executarea unui algoritm de sortare corespunde 
parcurgerii unui drum de la rădăcina arborelui de decizie către un vârf terminal. 
La fiecare vârf neterminal se efectuează o comparaţie între două elemente T[i] şi 
T| j]: dacă T[i] < T[ j] se continuă cu comparaţiile din subarborele stâng, iar în 
caz contrar cu cele din subarborele drept. Când se ajunge la un vârf terminal, 
înseamnă că algoritmul de sortare a reuşit să stabilească ordinea elementelor din 
T. 
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Fiecare din cele n! permutări a celor n elemente trebuie să apară ca vârf terminal 
în arborele de decizie. Vom lua ca barometru comparaţia între două elemente ale 
tabloului T. Înălţimea h a arborelui de decizie corespunde numărului de 
comparații pentru cel mai nefavorabil caz. Deoarece căutăm limita inferioară a 
timpului, ne interesează doar algoritmii cei mai performanti de sortare, deci putem 


presupune că numărul de vârfuri este minim, adică n!. Avem: n! < g” (demonstraţi 
acest lucrul), adică h > lg n!. Considerând şi relația log n! e O(n log n) (vezi 
Exerciţiul 5.17), rezultă că timpul de execuţie pentru orice algoritm de sortare 
prin comparaţie este, în cazul cel mai nefavorabil, în O(n log n). 


5.31 Analizaţi algoritmul heapsort pentru cel mai favorabil caz. Care este cel 
mai favorabil caz? 


5.32 Analizaţi algoritmii fib2 şi fib3 din Secţiunea 1.6.4. 
Soluţie: 
i) Se deduce imediat că timpul pentru fib? este în O(n). 


ii) Pentru a analiza algoritmul fib3, luăm ca barometru instrucțiunile din bucla 
while. Fie n, valoarea lui n la sfârşitul executării celei de-a t-a bucle. În 


particular, n, = In]. Dacă 2 <r< m, atunci 
n, = |n, 2] < n,_,2 
Deci, 


DD o <... < ni2 


Fie m = 1+ Lig n]. Deducem: 
N S n/2” < 1 


Dar, n„ € N, şi deci, n„=0, care este condiția de ieşire din buclă. Cu alte 


cuvinte, bucla este executată de cel mult m ori, timpul lui fib3 fiind în O(log n). 
Arătați că timpul este de fapt în O(log n). 


La analiza acestor doi algoritmi, am presupus implicit că operațiile efectuate sunt 
independente de mărimea operanzilor. Astfel, timpul necesar adunării a două 
numere este independent de mărimea numerelor şi este mărginit superior de o 
constantă. Dacă nu mai considerăm această ipoteză, atunci analiza se complică. 


5.33 Rezolvaţi recurența 7, — 3t, — 4t,—2 = 0, unde n > 2, iar tọ = 0, 4 = 1. 
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5.34 Care este ordinul timpului de execuţie pentru un algoritm recursiv cu 
recurenţa t, = 2t, +n. 


Indicaţie: Se ajunge la ecuația caracteristică (x-2)(x-1)° = 0, iar soluția generală 
este t, = c2"+ c,1” + can”. Rezultă t € 0O(2”). 


Substituind soluția generală înapoi în recurenţă, obținem că, indiferent de condiția 
iniţială, c, = —2 şi c} = —1. Atunci, toate soluţiile interesante ale recurenţei trebuie 


să aibă c} > O şi ele sunt toate în Q(2”), deci în 90"). 


5.35 Scrieţi o variantă recursivă a algoritmului de sortare prin inserție şi 
determinaţi ordinul timpului de execuţie pentru cel mai nefavorabil caz. 


Indicaţie: Pentru a sorta T[1 .. n], sortăm recursiv T[1 .. n—1] şi inserăm T[n] în 
tabloul sortat T[1 .. n—1]. 


5.36  Determinaţi prin schimbare de variabilă ordinul timpului de execuţie 
pentru un algoritm cu recurenţa T(n) = 2T(n/2) + n lg n, unde n > 1 este o putere a 
lui 2. 


Indicaţie: T(n) e O(n log?n | n este o putere a lui 2) 


5.37 Demonstraţi Proprietatea 5.2, folosind tehnica schimbării de variabilă. 


6. Algoritmi greedy 


Puşi în faţa unei probleme pentru care trebuie să elaborăm un algoritm, de multe 
ori “nu ştim cum să începem”. Ca şi în orice altă activitate, există câteva principii 
generale care ne pot ajuta în această situaţie. Ne propunem să prezentăm în 
următoarele capitole tehnicile fundamentale de elaborare a algoritmilor. Câteva 
din aceste metode sunt atât de generale, încât le folosim frecvent, chiar dacă 
numai intuitiv, ca reguli elementare în gândire. 


6.1 Tehnica greedy 


Algoritmii greedy (greedy = lacom) sunt în general simpli şi sunt folosiți la 
probleme de optimizare, cum ar fi: să se găsească cea mai bună ordine de 
executare a unor lucrări pe calculator, să se găsească cel mai scurt drum într-un 
graf etc. În cele mai multe situații de acest fel avem: 


e o mulțime de candidați (lucrări de executat, vârfuri ale grafului etc) 


e o funcție care verifică dacă o anumită mulțime de candidați constituie o soluție 
posibilă, nu neapărat optimă, a problemei 

e o funcție care verifică dacă o mulțime de candidați este fezabilă, adică dacă 
este posibil să completăm această mulțime astfel încât să obţinem o soluție 
posibilă, nu neapărat optimă, a problemei 

e o funcție de selecție care indică la orice moment care este cel mai promițător 
dintre candidații încă nefolosiți 


e o funcție obiectiv care dă valoarea unei soluții (timpul necesar executării 
tuturor lucrărilor într-o anumită ordine, lungimea drumului pe care l-am găsit 
etc); aceasta este funcția pe care urmărim să o optimizăm 
(minimizăm/maximizăm) 

Pentru a rezolva problema noastră de optimizare, căutăm o soluție posibilă care să 

optimizeze valoarea funcției obiectiv. Un algoritm greedy construieşte soluția pas 

cu pas. Inițial, mulțimea candidaților selectați este vidă. La fiecare pas, încercăm 
să adăugăm acestei mulțimi cel mai promițător candidat, conform funcției de 
selecție. Dacă, după o astfel de adăugare, mulțimea de candidați selectați nu mai 
este fezabilă, eliminăm ultimul candidat adăugat; acesta nu va mai fi niciodată 
considerat. Dacă, după adăugare, mulțimea de candidați selectați este fezabilă, 
ultimul candidat adăugat va rămâne de acum încolo în ea. De fiecare dată când 
lărgim mulțimea candidaților selectați, verificăm dacă această mulțime nu 
constituie o soluție posibilă a problemei noastre. Dacă algoritmul greedy 
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funcționează corect, prima soluţie găsită va fi totodată o soluţie optimă a 
problemei. Soluţia optimă nu este în mod necesar unică: se poate ca funcția 
obiectiv să aibă aceeaşi valoare optimă pentru mai multe soluţii posibile. 
Descrierea formală a unui algoritm greedy general este: 


function greedy(C) 
{C este mulțimea candidaţilor) 
S Ø {S este mulțimea în care construim soluţia) 
while not soluție(S) and C + Ø do 
x < un element din C care maximizează/minimizează select(x) 
CeC!lx) 
if fezabil(S O {x}) then S e Su {x} 
if soluție(S) then return S 
else return “nu există soluție” 


Este de înțeles acum de ce un astfel de algoritm se numeşte “lacom” (am putea 
să-i spunem şi “nechibzuit”). La fiecare pas, procedura alege cel mai bun candidat 
la momentul respectiv, fără să-i pese de viitor şi fără să se răzgândească. Dacă un 
candidat este inclus în soluție, el rămâne acolo; dacă un candidat este exclus din 
soluție, el nu va mai fi niciodată reconsiderat. Asemenea unui întreprinzător 
rudimentar care urmăreşte câştigul imediat în dauna celui de perspectivă, un 
algoritm greedy acționează simplist. Totuşi, ca şi în afaceri, o astfel de metodă 
poate da rezultate foarte bune tocmai datorită simplităţii ei. 


Funcția select este de obicei derivată din funcția obiectiv; uneori aceste două 
funcții sunt chiar identice. 


Un exemplu simplu de algoritm greedy este algoritmul folosit pentru rezolvarea 
următoarei probleme. Să presupunem că dorim să dăm restul unui client, folosind 
un număr cât mai mic de monezi. In acest caz, elementele problemei sunt: 


e candidații: mulțimea inițială de monezi de 1, 5, şi 25 unități, în care 
presupunem că din fiecare tip de monedă avem o cantitate nelimitată 

e o soluție posibilă: valoarea totală a unei astfel de mulțimi de monezi selectate 
trebuie să fie exact valoarea pe care trebuie să o dăm ca rest 

e o mulțime fezabilă: valoarea totală a unei astfel de mulțimi de monezi selectate 
nu este mai mare decât valoarea pe care trebuie să o dăm ca rest 


e funcția de selecție: se alege cea mai mare monedă din mulțimea de candidați 
rămasă 


e funcția obiectiv: numărul de monezi folosite în soluție; se doreşte minimizarea 
acestui număr 


Se poate demonstra că algoritmul greedy va găsi în acest caz mereu soluția optimă 
(restul cu un număr minim de monezi). Pe de altă parte, presupunând că există şi 
monezi de 12 unități sau că unele din tipurile de monezi lipsesc din mulțimea 
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inițială de candidaţi, se pot găsi contraexemple pentru care algoritmul nu găseşte 
soluţia optimă, sau nu găseşte nici o soluţie cu toate că există soluţie. 


Evident, soluţia optimă se poate găsi încercând toate combinările posibile de 
monezi. Acest mod de lucru necesită însă foarte mult timp. 


Un algoritm greedy nu duce deci întotdeauna la soluţia optimă, sau la o soluţie. 
Este doar un principiu general, urmând ca pentru fiecare caz în parte să 
determinăm dacă obţinem sau nu soluţia optimă. 


6.2  Minimizarea timpului mediu de așteptare 


O singură staţie de servire (procesor, pompă de benzină etc) trebuie să satisfacă 
cererile a n clienţi. Timpul de servire necesar fiecărui client este cunoscut în 
prealabil: pentru clientul i este necesar un timp î;, 1 <i <n. Dorim să minimizăm 


timpul total de aşteptare 


T= `. (timpul de aşteptare pentru clientul i) 
i=1 


ceea ce este acelaşi lucru cu a minimiza timpul mediu de aşteptare, care este T/n. 
De exemplu, dacă avem trei clienți cu £, = 5, t, = 10, t, = 3, sunt posibile şase 
ordini de servire. În primul caz, clientul 1 este servit primul, clientul 2 aşteaptă 


Ordinea T 

1 123 5+(5+10)+(5+10+3) = 38 

1 3 2 5+(5+3)+(5+3+10) = 31 

2 1 3 10+(10+5)+(10+5+3) = 43 

23 3 5] 10+(10+3)+(10+3+5) = 41 

3 1 2 3+(3+5)+(3+5+10) = 29 < optim 
3 2 1 3+(3+10)+(3+10+5) = 34 


până este servit clientul 1 şi apoi este servit, clientul 3 aşteaptă până sunt serviţi 
clienții 1, 2 şi apoi este servit. Timpul total de aşteptare a celor trei clienți este 
38. 


Algoritmul greedy este foarte simplu: la fiecare pas se selectează clientul cu 
timpul minim de servire din mulțimea de clienți rămasă. Vom demonstra că acest 
algoritm este optim. Fie 


I=(i; i.. i) 


o permutare oarecare a întregilor {1, 2, ..., n). Dacă servirea are loc în ordinea Z, 
avem 
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n 
TU) = ti +, +.) Et, Tir... = nt; +n- Dt, +... = X n-k+Dt,, 
k=l 


Presupunem acum că / este astfel încât putem găsi doi întregi a < b cu 


t >t; 


la 


Interschimbăm pe i, cu i, în I; cu alte cuvinte, clientul care a fost servit al b-lea 


va fi servit acum al a-lea şi invers. Obținem o nouă ordine de servire J, care este 
de preferat deoarece 


T(J) = (n-a+1)t, +(n-b+1)t; + X (n-k+D)t, 
k=l 
kza,b 


TUD= TU) = (n-a +1) (f -t )+(n-b+1) (t -t ) = ba =) >0 


Prin metoda greedy obținem deci întotdeauna planificarea optimă a clienților. 


Problema poate fi generalizată pentru un sistem cu mai multe stații de servire. 


6.3  Interclasarea optimă a şirurilor ordonate 


Să presupunem că avem două şiruri $} şi S, ordonate crescător şi că dorim să 


obținem prin interclasarea lor șirul ordonat crescător care conţine elementele din 
cele două şiruri. Dacă interclasarea are loc prin deplasarea elementelor din cele 
două șiruri în noul șir rezultat, atunci numărul deplasărilor este 4S, + #S,. 


Generalizând, să considerăm acum n şiruri S$,, S>, ..., S, fiecare şir S, 1<i<n, 
fiind format din q, elemente ordonate crescător (vom numi q, lungimea lui $;). Ne 


propunem să obținem şirul S$ ordonat crescător, conținând exact elementele din 
cele n şiruri. Vom realiza acest lucru prin interclasări succesive de câte două 
şiruri. Problema constă în determinarea ordinii optime în care trebuie efectuate 
aceste interclasări, astfel încât numărul total al deplasărilor să fie cât mai mic. 
Exemplul de mai jos ne arată că problema astfel formulată nu este banală, adică 
nu este indiferent în ce ordine se fac interclasările. 


Fie şirurile $,, S), S de lungimi q, = 30, q, = 20, q} = 10. Dacă interclasăm pe S; 
cu S,, iar rezultatul îl interclasăm cu S,, numărul total al deplasărilor este 
(30+20)+(50+10) = 110. Dacă îl interclasăm pe S, cu S,, iar rezultatul îl 
interclasăm cu S,, numărul total al deplasărilor este (10+20)+(30+30) = 90. 


Ataşăm fiecărei strategii de interclasare câte un arbore binar în care valoarea 
fiecărui vârf este dată de lungimea șirului pe care îl reprezintă. Dacă şirurile 
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(b) 


Figura 6.1 Reprezentarea strategiilor de interclasare. 


Sis Sa.» Sg au lungimile q, = 30, q, = 10, q} = 20, q, = 30, q; = 50, q= 10, 


două astfel de strategii de interclasare sunt reprezentate prin arborii din Figura 
6.1. 


Observăm că fiecare arbore are 6 vârfuri terminale, corespunzând celor 6 şiruri 
inițiale şi 5 vârfuri neterminale, corespunzând celor 5 interclasări care definesc 
strategia respectivă. Numerotăm vârfurile în felul următor: vârful terminal i, 
1 <i<6, va corespunde șirului S, iar vârfurile neterminale se numerotează de la 


7 la 11 în ordinea obținerii interclasărilor respective (Figura 6.2). 


Strategia greedy apare în Figura 6.lb şi constă în a interclasa mereu cele mai 
scurte două şiruri disponibile la momentul respectiv. 


Interclasând şirurile S$,, $,, ..., S de lungimi q,, q2, --:» da» obţinem pentru 


e e 0 © 
(b) 


Figura 6.2 Numerotarea vârfurilor arborilor din Figura 6.1. 
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fiecare strategie câte un arbore binar cu n vârfuri terminale, numerotate de la 1 la 
n, şi n-l vârfuri neterminale, numerotate de la n+1 la 2n-1. Definim, pentru un 
arbore oarecare A de acest tip, lungimea externă ponderată: 


n 
L(A) = au; 
i=1 
unde a, este adâncimea vârfului i. Se observă că numărul total de deplasări de 


elemente pentru strategia corespunzătoare lui A este chiar L(A). Soluţia optimă a 
problemei noastre este atunci arborele (strategia) pentru care lungimea externă 
ponderată este minimă. 


Proprietatea 6.1 Prin metoda greedy se obţine întotdeauna interclasarea optimă a 
n şiruri ordonate, deci strategia cu arborele de lungime externă ponderată minimă. 


Demonstraţie: Demonstrăm prin inducţie. Pentru n= 1, proprietatea este 
verificată. Presupunem că proprietatea este adevărată pentru n-l şiruri. Fie A 
arborele strategiei greedy de interclasare a n şiruri de lungime q; < q, <... q,. Fie 


B un arbore cu lungimea externă ponderată minimă, corespunzător unei strategii 
optime de interclasare a celor n şiruri. În arborele A apare subarborele 


reprezentând prima interclasare făcută conform strategiei greedy. In arborele B, 
fie un vârf neterminal de adâncime maximă. Cei doi fii ai acestui vârf sunt atunci 
două vârfuri terminale d; şi q} Fie B' arborele obţinut din B schimbând între ele 


vârfurile q, şi dp respectiv q, şi q, Evident, L(B)s<L(B). Deoarece B are 
lungimea externă ponderată minimă, rezultă că L(B') = L(B). Eliminând din B' 
vârfurile q; şi q), obţinem un arbore B” cu n-l vârfuri terminale q,+q, q3; -> qi: 
Arborele B' are lungimea externă ponderată minimă și L(B') = L(B") + (q,+q)). 
Rezultă că şi B" are lungimea externă ponderată minimă. Atunci, conform ipotezei 


inducției, avem L(B")= L(A'), unde A' este arborele strategiei greedy de 
interclasare a şirurilor de lungime g,+q q3, .... q, Cum A se obţine din A' 


ataşând la vârful q,+q, fiii q, şi q,, iar B' se obţine în acelaşi mod din B”, rezultă 
că L(A) = L(B') = L(B). Proprietatea este deci adevărată pentru orice n. pg 


La scrierea algoritmului care generează arborele strategiei greedy de interclasare 
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vom folosi un min-heap. Fiecare element al min-heap-ului este o pereche (q, i) 
unde i este numărul unui vârf din arborele strategiei de interclasare, iar q este 
lungimea şirului pe care îl reprezintă. Proprietatea de min-heap se referă la 
valoarea lui q. 


Algoritmul interopt va construi arborele strategiei greedy. Un vârf i al arborelui 
va fi memorat în trei locaţii diferite conținând: 


LU[i] = lungimea şirului reprezentat de vârf 
ST[i] numărul fiului stâng 
DR[i] numărul fiului drept 


procedure interopt(Q[1 .. n]) 
{construieşte arborele strategiei greedy de interclasare 
a şirurilor de lungimi O[i] =q, 1<i<n} 

H < min-heap vid 

for i — 1 ton do 
(O[i], Ò) => H {inserează în min-heap) 
LULi] — Oli]; ST[i] — 0; DR[i] — 0 

for i e n+1 to 2n-l do 
(s,j) e H {extrage rădăcina lui H} 
(r, k) e H {extrage rădăcina lui H} 
ST[i] < j; DR[i] — k; LU[i] < s+r 
(LU[i], Ò) => H {inserează în min-heap) 


În cazul cel mai nefavorabil, operaţiile de inserare în min-heap şi de extragere din 
min-heap necesită un timp în ordinul lui log n (revedeţi Exerciţiul 5.27). Restul 
operaţiilor necesită un timp constant. Timpul total pentru interopr este deci în 
O(n log n). 


6.4 Implementarea arborilor de interclasare 


Transpunerea procedurii interopt într-un limbaj de programare prezintă o singură 
dificultate generată de utilizarea unui min-heap de perechi vârf-lungime. În 
limbajul C++, implementarea arborilor de interclasare este aproape o operaţie de 
rutină, deoarece clasa parametrică heap (Secţiunea 4.2.2) permite manipularea 
unor heap-uri cu elemente de orice tip în care este definit operatorul de comparare 
>. Altfel spus, nu avem decât să construim o clasă formată din perechi 
vârtf-lungime (pondere) şi să o completăm cu operatorul > corespunzător. Vom 
numi această clasă vp, adică vârf-pondere. 
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+ifndef __VP_H 
+define __VP_H 


tinclude <iostream.h> 
class vp | 
public: 
vpi int vf = 0, float pd = 0) {y = vf; p= pd; ) 


operator int ( ) const { return v; } 
operator float( ) const { return p; } 


int yvy float pý 
}; 


inline operator > ( const vp& a, const vp& b) { 
return a.p < b.p; 
) 
inline istream& operator >>( istream& is, vp& element ) | 


is >> element.v >> element.p; element.v--; 
return is; 


) 


inline ostream& operator <<( ostream& os, vp& element ) | 
os << 1[ T << (element.v+l) << mp n << element.,p <4 |” 
return osi 


) 
tendif 


Scopul clasei vp (definită în fişierul vp.h) nu este de a introduce un nou tip de 
date, ci mai curând de a facilita manipularea structurii vârf-pondere, structură 
utilă şi la reprezentarea grafurilor. Din acest motiv, nu există nici un fel de 
încapsulare, toți membrii fiind publici. Pentru o mai mare comoditate în utilizare, 
am inclus în definiție cei doi operatori de conversie, la int, respectiv la float, 
precum şi operatorii de intrare/ieşire. 


Nu ne mai rămâne decât să precizăm structura arborelui de interclasare. Cel mai 
simplu este să preluăm structura folosită în procedura interopt din Secţiunea 6.3: 
arborele este format din trei tablouri paralele, care conţin lungimea şirului 
reprezentat de vârful respectiv şi indicii celor doi fii. Pentru o scriere mai 
compactă, vom folosi totuşi o structură puțin diferită: un tablou de elemente de tip 
nod, fiecare nod conținând trei câmpuri corespunzătoare informaţiilor de mai sus. 
Clasa nod este similară clasei vp, atât ca structură, cât şi prin motivaţia 
introducerii ei. 
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class nod { 

public: 
int lu; // lungimea 
int sty Ji fiul stang 
int dr; // fiul drept 

); 


inline ostream& operator <<( ostream& os, nod nd) { 
SE VAN gd ndst e Ma n 
x nd. lu 
da H ph g4 DAE << "p T3 


return os; 


) 


În limbajul C++, funcţia de construire a arborelui strategiei greedy se obţine 
direct, prin transcrierea procedurii interopt. 


tablou<nod> interopt ( const tablou<int>& O) { 
int n > OuBize )7 
tablou<nod> A( // arborele de interclasare 
heap <vp> H( 


for | int i = 0# 1 «ñj dk) { 
H.inserti vp(i, OLII) Jý 
A[i].lu = Q[i]; A[i].st = A[i].dr = -1; 

} 

for | 1 =ñ; i <a * p= l itk) { 
vp s; H.delete_max( s); 
vp r; H.delete max(r); 
A[i].st = s; Ali].dr = r; 
Ali]. lu = (floats + (float)r; 
H.insert ( vp(i, A[i].lu) ); 

} 


return A; 


Funcția de mai sus conține două aspecte interesante: 


Constructorul vp (int, float) este invocat explicit în funcția de inserare în 
heap-ul H. Efectul acestei invocări constă în crearea unui obiect temporar de 
tip vp, obiect distrus după inserare. O notație foarte simplă ascunde deci şi o 
anumită ineficiență, datorată creării şi distrugerii obiectului temporar. 

Operatorul de conversie la int este invocat implicit în expresiile A[i].st = s 
şi A[i].dr = r, iar în expresia A[i].lu = (float)s + (float) r, 
operatorul de conversie la float trebuie să fie specificat explicit. Semantica 
limbajului C++ este foarte clară relativ la conversii: cele utilizator au 
prioritate faţă de cele standard, iar ambiguitatea în selectarea conversiilor 
posibile este semnalată ca eroare. Dacă în primele două atribuiri conversia lui 
s şi r la int este singura posibilitate, scrierea celei de-a treia sub forma 
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A[i].lu = s + reste ambiguă, expresia s + r putând fi evaluată atât ca int 
cât şi ca float. 


În final, nu ne mai rămâne decât să testăm funcţia interopt (). Vom folosi un 
tablou 1 cu lungimi de şiruri, lungimi extrase din stream-ul standard de intrare. 


main ) 4 
tablonsint> Lz 
gout <4 Papei e Te gin e Ls 
cout << "Arborele de interclasare: "; 
cout << interopt{ |) << "in! 


return 1; 


Strategia de interclasare optimă pentru cele şase lungimi folosite ca exemplu în 
Secţiunea 6.3: 


[ © 139 10.20 30.50 10 


este: 


Arborele de interclasare: [11]: <-1< 30 >-1> <-1< 10 >-1> 
<=1< 20 21> g=l< 30 >=1> <=l< 50 >=1> sole 10 >=> 
zig 20 555 <2< 40 >6> <34 60 >02 <7< 90 >4> 

xpa 150 29> 


Valoarea fiecărui nod este precedată de indicele fiului stâng şi urmată de cel al 
fiului drept, indicele -1 reprezentând legătura inexistentă. Formatele de citire şi 
scriere ale tablourilor sunt cele stabilite în Secțiunea 4.1.3. 


6.5 Coduri Huffman 


O altă aplicație a strategiei greedy şi a arborilor binari cu lungime externă 
ponderată minimă este obținerea unei codificări cât mai compacte a unui text. 


Un principiu general de codificare a unui şir de caractere este următorul: se 
măsoară frecvența de apariție a diferitelor caractere dintr-un eşantion de text şi se 
atribuie cele mai scurte coduri, celor mai frecvente caractere, şi cele mai lungi 
coduri, celor mai puțin frecvente caractere. Acest principiu stă, de exemplu, la 
baza codului Morse. Pentru situația în care codificarea este binară, există o 
metodă elegantă pentru a obține codul respectiv. Această metodă, descoperită de 
Huffman (1952) foloseşte o strategie greedy şi se numeşte codificarea Huffman. O 
vom descrie pe baza unui exemplu. 
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Fie un text compus din următoarele litere (în paranteze figurează frecvențele lor 
de apariţie): 
S (10), I (29), P (4), 0 (9), T (5) 


Conform metodei greedy, construim un arbore binar fuzionând cele două litere cu 
frecvențele cele mai mici. Valoarea fiecărui vârf este dată de frecvența pe care o 


reprezintă. 
a" 


Etichetăm muchia stângă cu 1 şi muchia dreaptă cu 0. Rearanjăm tabelul de 
frecvente: 


S (10), I (29), O (9), {P, T} (4+5 = 9) 


Mulțimea {P, T} semnifică evenimentul reuniune a celor două evenimente 
independente corespunzătoare apariției literelor P şi T. Continuăm procesul, 
obținând arborele 


Pa se 
1 | 0 © 
P @ 


În final, ajungem la arborele din Figura 6.3, în care fiecare vârf terminal 
corespunde unei litere din text. 


Pentru a obține codificarea binară a literei P, nu avem decât să scriem secvența de 
O-uri şi l-uri în ordinea apariției lor pe drumul de la rădăcină către vârful 
corespunzător lui P: 1011. Procedăm similar şi pentru restul literelor: 


S (11), I (0), P (1011), O (100), T (1010) 


Pentru un text format din n litere care apar cu frecvențele fi, fa, ..., f„„ un arbore 
de codificare este un arbore binar cu vârfurile terminale având valorile 
is fos --- fp prin care se obţine o codificare binară a textului. Un arbore de 
codificare nu trebuie în mod necesar să fie construit după metoda greedy a lui 
Huffman, alegerea vârfurilor care sunt fuzionate la fiecare pas putându-se face 
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Figura 6.3 Arborele de codificare Huffman. 


după diverse criterii. Lungimea externă ponderată a unui arbore de codificare 
este: 


n 
b2 a; fi 
i=1 


unde a, este adîncimea vârfului terminal corespunzător literei i. Se observă că 


lungimea externă ponderată este egală cu numărul total de caractere din 
codificarea textului considerat. Codificarea cea mai compactă a unui text 
corespunde deci arborelui de codificare de lungime externă ponderată minimă. Se 
poate demonstra că arborele de codificare Huffman minimizează lungimea externă 
ponderată pentru toți arborii de codificare cu vârfurile terminale având valorile 
fofa -fp Prin strategia greedy se obține deci întotdeauna codificarea binară 


cea mai compactă a unui text. 


Arborii de codificare pe care i-am considerat în acestă secțiune corespund unei 
codificări de tip special: codificarea unei litere nu este prefixul codificării nici 
unei alte litere. O astfel de codificare este de tip prefix. Codul Morse nu face 
parte din această categorie. Codificarea cea mai compactă a unui şir de caractere 
poate fi întotdeauna obținută printr-un cod de tip prefix. Deci, concentrându-ne 
atenția asupra acestei categorii de coduri, nu am pierdut nimic din generalitate. 


6.6 Arbori partiali de cost minim 


Fie G = <V, M> un graf neorientat conex, unde V este mulțimea vârfurilor şi M 
este mulțimea muchiilor. Fiecare muchie are un cost nenegativ (sau o lungime 
nenegativă). Problema este să găsim o submulțime A c M, astfel încât toate 
vârfurile din V să rămînă conectate atunci când sunt folosite doar muchii din A, 
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iar suma lungimilor muchiilor din A să fie cât mai mică. Căutăm deci o 
submulțime A de cost total minim. Această problemă se mai numește şi problema 
conectării orașelor cu cost minim, având numeroase aplicaţii. 


Graful parţial <V, A> este un arbore (Exerciţiul 6.11) şi este numit arborele 
parțial de cost minim al grafului G (minimal spanning tree). Un grat poate avea 
mai mulți arbori parţiali de cost minim și acest lucru se poate verifica pe un 
exemplu. 


Vom prezenta doi algoritmi greedy care determină arborele parţial de cost minim 
al unui graf. În terminologia metodei greedy, vom spune că o mulţime de muchii 
este o soluție, dacă constituie un arbore parţial al grafului G, şi este fezabilă, dacă 
nu conţine cicluri. O mulțime fezabilă de muchii este promițătoare, dacă poate fi 
completată pentru a forma soluția optimă. O muchie atinge o mulțime dată de 
vârfuri, dacă exact un capăt al muchiei este în mulțime. Următoarea proprietate va 
fi folosită pentru a demonstra corectitudinea celor doi algoritmi. 


Proprietatea 6.2 Fie G = <V, M> un graf neorientat conex în care fiecare muchie 
are un cost nenegativ. Fie W c V o submulțime strictă a vârfurilor lui G şi fie 
ASM o mulţime promițătoare de muchii, astfel încât nici o muchie din A nu 
atinge W. Fie m muchia de cost minim care atinge W. Atunci, AU (m) este 
promițătoare. 


Demonstraţie: Fie B un arbore parţial de cost minim al lui G, astfel încât A c B 
(adică, muchiile din A sunt conţinute în arborele B). Un astfel de B trebuie să 
existe, deoarece A este promițătoare. Dacă me B, nu mai rămâne nimic de 
demonstrat. Presupunem că m ¢ B. Adăugându-l pe m la B, obţinem exact un ciclu 
(Exerciţiul 3.2). În acest ciclu, deoarece m atinge W, trebuie să mai existe cel 
puţin o muchie m' care atinge şi ea pe W (altfel, ciclul nu se închide). Eliminându- 
l pe m', ciclul dispare şi obținem un nou arbore parţial B' al lui G. Costul lui m 
este mai mic sau egal cu costul lui m', deci costul total al lui B' este mai mic sau 
egal cu costul total al lui B. De aceea, B’ este şi el un arbore parţial de cost minim 
al lui G, care include pe m. Observăm că A c B' deoarece muchia m', care atinge 
W, nu poate fi în A. Deci, A U (m) este promițătoare. pg 


Mulțimea iniţială a candidaților este M. Cei doi algoritmi greedy aleg muchiile 
una câte una într-o anumită ordine, această ordine fiind specifică fiecărui 
algoritm. 


6.6.1 Algoritmul lui Kruskal 


Arborele parţial de cost minim poate fi construit muchie, cu muchie, după 
următoarea metodă a lui Kruskal (1956): se alege întâi muchia de cost minim, iar 
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(a) 


Capitolul 6 


0—0- © 


(b) 


Figura 6.4 Un graf şi arborele său parțial de cost minim. 


apoi se adaugă repetat muchia de cost minim nealeasă anterior şi care nu formează 
cu precedentele un ciclu. Alegem astfel #V—1 muchii. Este uşor de dedus că 
obținem în final un arbore (revedeți Exercițiul 3.2). Este însă acesta chiar arborele 
parțial de cost minim căutat? 


Înainte de a răspunde la întrebare, să considerăm, de exemplu, graful din Figura 
6.4a. Ordonăm crescător (în funcție de cost) muchiile grafului: (1,2), (2,3), 
{4,5}, {6,7}, {1,4}, (2, 5), (4, 7), (3, 5), {2,4}, (3,6), {5,7}, {5, 6} şi apoi 
aplicăm algoritmul. Structura componentelor conexe este ilustrată, pentru fiecare 


pas, în Tabelul 6.1. 


Mulțimea A este inițial vidă şi se completează pe parcurs cu muchii acceptate 


Pasul 


inițializare 
1 


y AURA UMN 


Muchia considerată 


(1, 2) 
(2, 3) 
(4, 5) 
(6,7) 
(1,4) 
(2, 5) 
(4,7) 


Componentele conexe ale 
subgrafului <V, A> 


11), {2}, 13), 44), {5}, {6}, 17) 
{1,2}, {3}, {4}, {5}, {6}, {7} 
{1, 2,3}, {4}, {5}, {6}, {7} 
{1, 2,3}, {4, 5}, {6}, {7} 
{1,2,3}, (4, 5), {6,7} 

{1, 2,3,4,5}, {6,7} 
respinsă (formează ciclu) 

{1, 2,3, 4,5,6,7} 


Tabelul 6.1 Algoritmul lui Kruskal aplicat grafului din Figura 6.4a. 
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(care nu formează un ciclu cu muchiile deja existente în A). În final, mulțimea A 
va conţine muchiile (1, 2), (2, 3), (4, 5), (6, 7), {1,4}, (4,7). La fiecare pas, 
graful parţial <V, A> formează o pădure de componente conexe, obținută din 
pădurea precedentă unind două componente. Fiecare componentă conexă este la 
rândul ei un arbore parţial de cost minim pentru vârfurile pe care le conectează. 
Iniţial, fiecare vârf formează o componentă conexă. La sfârșit, vom avea o singură 
componentă conexă, care este arborele parţial de cost minim căutat (Figura 6.4b). 


Ceea ce am observat în acest caz particular este valabil şi pentru cazul general, 
din Proprietatea 6.2 rezultând: 


Proprietatea 6.3 În algoritmul lui Kruskal, la fiecare pas, graful parţial <V, A> 
formează o pădure de componente conexe, în care fiecare componentă conexă este 
la rândul ei un arbore parţial de cost minim pentru vârfurile pe care le conectează. 
În final, se obţine arborele parţial de cost minim al grafului G. m 


Pentru a implementa algoritmul, trebuie să putem manipula submulțimile formate 
din vârfurile componentelor conexe. Folosim pentru aceasta o structură de 
mulțimi disjuncte şi procedurile de tip find şi merge (Secţiunea 3.5). În acest caz, 
este preferabil să reprezentăm graful ca o listă de muchii cu costul asociat lor, 
astfel încât să putem ordona această listă în funcţie de cost. Iată algoritmul: 


function Kruskal(G = <V, M>) 
tiniţializare) 
sortează M crescător în funcţie de cost 
n e #V 
A — Ø {va conţine muchiile arborelui parțial de cost minim} 
inițializează n mulțimi disjuncte conținând 
fiecare câte un element din V 


{buclă greedy} 
repeat 

{u, v} e muchia de cost minim care 

încă nu a fost considerată 

ucomp + find(u) 

vcomp + find(v) 

if ucomp + vcomp then merge(ucomp, vcomp) 

AAU f{{u,v}} 

until #A = n-1 
return A 


Pentru un graf cu n vârfuri şi m muchii, presupunând că se folosesc procedurile 
find3 şi merge3, numărul de operații pentru cazul cel mai nefavorabil este în: 


128 Algoritmi greedy Capitolul 6 


Pasul Muchia considerată U 
inițializare — {1} 
1 42, 1) {1,2} 
2 13,2) 41,2, 3] 
3 {4,1} {1,2,3,4} 
4 {5,4} 11,2,3,4,5) 
5 {7,4} {1, 2,3, 4, 5, 6} 
6 {6,7} {1, 2,3, 4,5,6,7} 


Tabelul 6.2 Algoritmul lui Prim aplicat grafului din Figura 6.4a. 


e O(mlogm) pentru a sorta muchiile. Deoarece m < n(n-1)/2, rezultă 
O(m log m) c O(m log n). Mai mult, graful fiind conex, din n—1 < m rezultă şi 
O(m log n) < O(m log m), deci O(m log m) = O(m log n). 

e O(n) pentru a inițializa cele n mulțimi disjuncte. 

e Cele cel mult 2m operații find3 şi n-l operații merge3 necesită un timp în 
O((2m+n—-1)lg* n), după cum am specificat în Capitolul 3. Deoarece 
O(lg* n) c O(log n) şi n-1 < m, acest timp este şi în O(m log n). 

e O(m) pentru restul operațiilor. 


Deci, pentru cazul cel mai nefavorabil, algoritmul lui Kruskal necesită un timp în 
O(m log n). 


O alta variantă este să păstrăm muchiile într-un min-heap. Obținem astfel un nou 
algoritm, în care inițializarea se face într-un timp în O(m), iar fiecare din cele n-l 
extrageri ale unei muchii minime se face într-un timp în O(log m) = O(log n). 
Pentru cazul cel mai nefavorabil, ordinul timpului rămâne acelaşi cu cel al 
vechiului algoritm. Avantajul folosirii min-heap-ului apare atunci când arborele 
parțial de cost minim este găsit destul de repede şi un număr considerabil de 
muchii rămân netestate. În astfel de situații, algoritmul vechi pierde timp, sortând 
în mod inutil şi aceste muchii. 


6.6.2 Algoritmul lui Prim 


Cel de-al doilea algoritm greedy pentru determinarea arborelui parțial de cost 
minim al unui graf se datorează lui Prim (1957). În acest algoritm, la fiecare pas, 
mulțimea A de muchii alese împreună cu mulțimea U a vârfurilor pe care le 
conectează formează un arbore parţial de cost minim pentru subgraful <U, A> al 
lui G. Iniţial, mulțimea U a vârfurilor acestui arbore conţine un singur vârf 
oarecare din V, care va fi rădăcina, iar mulțimea A a muchiilor este vidă. La 
fiecare pas, se alege o muchie de cost minim, care se adaugă la arborele 
precedent, dând naştere unui nou arbore parțial de cost minim (deci, exact una 
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dintre extremităţile acestei muchii este un vârf în arborele precedent). Arborele 
parţial de cost minim creşte “natural”, cu câte o ramură, pînă când va atinge toate 
vârfurile din V, adică pînă când U = V. Funcționarea algoritmului, pentru 
exemplul din Figura 6.4a, este ilustrată în Tabelul 6.2. La sfârşit, A va conţine 
aceleaşi muchii ca şi în cazul algoritmului lui Kruskal. Faptul că algoritmul 
funcționează întotdeauna corect este exprimat de următoarea proprietate, pe care o 
puteţi demonstra folosind Proprietatea 6.2. 


Proprietatea 6.4 În algoritmul lui Prim, la fiecare pas, <U, A> formează un 
arbore parţial de cost minim pentru subgraful <U, A> al lui G. In final, se obţine 
arborele parţial de cost minim al grafului G. m 


Descrierea formală a algoritmului este dată în continuare. 


function Prim-formal(G = <V, M>) 

{inițializare } 

A< Ø {va conține muchiile arborelui parțial de cost minim} 

U & {un vârf oarecare din V} 

{buclă greedy} 

while U + V do 
găseşte {u, v} de cost minim astfel caue V\Uşive U 
ASAU f{{u, v}} 
Ue Uu {u} 

return A 


Pentru a obţine o implementare simplă, presupunem că: vârfurile din V sunt 
numerotate de la 1 la n, V = {1, 2, ..., n}, matricea simetrică C dă costul fiecărei 
muchii, cu C[i,j] = +, dacă muchia {i,j} nu există. Folosim două tablouri 
paralele. Pentru fiecare i e V \ U, vecini] conţine vârful din U, care este conectat 
de i printr-o muchie de cost minim; mincost[i] dă acest cost. Pentru i e U, punem 
mincostli] = —1. Mulțimea U, în mod arbitrar inițializată cu {1}, nu este 
reprezentată explicit. Elementele vecin[1] şi mincost[ 1] nu se folosesc. 
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function Prim(C[l ..n, 1.. n]) 
tiniţializare; numai vârful 1 este în U} 
AD 
for i + 2 to ndo vecini] < 1 
mincost[i] — C[i, 1] 
{buclă greedy} 
repeat n-1 times 
min — +% 
for j — 2 to n do 
if O < mincost| j] < min then min <+ mincost[ j] 
kej 
A & AU {{k, vecinlk])) 
mincost|k] — -1 {adaugă vârful k la U} 
for j — 2 to n do 
if C[k, j] < mincost| j] then mincosti j] — C[Īk, j] 
vecin| j] — k 
return A 


Bucla principală se execută de n-l ori şi, la fiecare iterație, buclele for din 
interior necesită un timp în O(n). Algoritmul Prim necesită, deci, un timp în 
O(n”). Am văzut că timpul pentru algoritmul lui Kruskal este în O(m log n), unde 
m = #M. Pentru un graf dens (adică, cu foarte multe muchii), se deduce că m se 
apropie de n(n-1)/2. În acest caz, algoritmul Kruskal necesită un timp în 
O(n? log n) şi algoritmul Prim este probabil mai bun. Pentru un graf rar (adică, cu 
un număr foarte mic de muchii), m se apropie de n şi algoritmul Kruskal necesită 
un timp în O(n log n), fiind probabil mai eficient decât algoritmul Prim. 


6.7 Implementarea algoritmului lui Kruskal 


Funcţia care implementează algoritmul lui Kruskal în limbajul C++ este aproape 
identică cu procedura Kruskal din Secţiunea 6.6.1. 


tablou<muchie> Kruskal( int n, const tablou<muchie>6 M ) { 
heap<muchie> h(M); 


tablou<muchie> A( n - 1 ); int nA = 0; 
set 20 du Dc, 
do { 

muchie m; 

if ( !h.delete_max( m ) ) 


{ cerr << "\n\nKruskal -- heap vid. nn"; return A = 0; ) 
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int ucomp = s.find3(m.u ), 
comp = s.find3( m.” ); 
if ( ucomp != vcomp ) 4 


s.merge3 ( ucomp, vcomp ); 
Al nA++ ] = mý 
) 
+ while | 2A f= m= 1 J} 


return A; 


Diferențele care apar sunt mai curând precizări suplimentare, absolut necesare în 
trecerea de la descrierea unui algoritm la implementarea lui. Astfel, graful este 
transmis ca parametru, prin precizarea numărului de vârfuri şi a muchiilor. Pentru 
muchii, reprezentate prin cele două vârfuri şi costul asociat, am preferat în locul 
listei, structura simplă de tablou M, structură folosită şi la returnarea arborelui de 
cost minim A. 


Operația principală efectuată asupra muchiilor este alegerea muchiei de cost 
minim care încă nu a fost considerată. Pentru implementarea acestei operații, 
folosim un min-heap. La fiecare iterație, se extrage din heap muchia de cost 
minim şi se încearcă inserarea ei în arborele A. 


Rulând programul 


main( ) { 
int Hi 
cout << T\nYarfüfisss "3 


Gin >> iè 


tablou<muchie> M; 
cout << "inMuchiile si costurile lor... "3 
cin >> M; 


cout << "\nArborele de cost minim Kruskal: n"; 
cout << Kruüuskal( n M J << "inis 
return 1; 


pentru graful din Figura 6.4a, obținem următoarele rezultate: 


Arborele de cost minim Kruskal: 
e Ee T 2 | 4 Ap 55 a a 77 3) 
i dp Ap a Ap Tm A] 


Clasa muchie, folosită în implementarea algoritmului lui Kruskal, trebuie să 
permită: 
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e Jnițializarea obiectelor, inclusiv cu valori implicite (iniţializare utilă la 
construirea tablourilor de muchii). 


e Compararea obiectelor în funcţie de cost (operaţie folosită de min-heap). 
e Operații de citire şi scriere (invocate indirect de operatorii respectivi din clasa 
tablou<T>). 


Pornind de la aceste cerinţe, se obţine următoarea implementare, conținută în 
fişierul muchie.h. 


+ifndef __MUCHIE_H 
+define __MUCHIE_H 


class muchie { 


public: 
muchia int iu = 0, int iv = 0, float ic = 0. ) 
{ u= iu; v = iv; cost = io; | 


mE U Yi 
float. costi 


); 


inline operator >( const muchie a, const muchie b ) { 
return a.cost < best: 


) 


inline istream& operator >>( istream& is, muchie m) 4 
is >> m:U S gt >> Mocost? D= Miv=S} 
return is; 


} 


inline ostream& operator<< ( ostream& os, muchie& m) { 
return OS <4 T T a€ (m:0t+1)] < 0, Taa (mM. VF) 
re wi " << m.cost d " pia 
} 
#endif 


În ceea ce priveşte clasa set, folosită şi ea în implementarea algoritmului 
Kruskal, vom urma precizările din Secţiunea 3.5 relative la manipularea 
mulțimilor disjuncte. Încapsularea, într-o clasă, a structurii de mulţimi disjuncte şi 
a procedurilor find3 şi merge3 nu prezintă nici un fel de dificultăți. Vom prezenta, 
totuşi, implementarea clasei set, deoarece spaţiul de memorie folosit este redus la 
jumătate. 


La o analiză mai atentă a procedurii merge3, observăm că tabloul înălțimii 
arborilor este folosit doar pentru elementele care sunt şi etichete de mulțimi (vezi 
Exerciţiul 3.13). Aceste elemente, numite elemente canonice, sunt rădăcini ale 
arborilor respectivi. Altfel spus, un element canonic nu are tată şi valoarea lui 
este folosită doar pentru a-l diferenţia de elementele care nu sunt canonice. În 
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Secţiunea 3.5, elementele canonice sunt diferenţiate prin faptul că set[i] are 
valoarea i. Având în vedere că set[i] este indicele în tabloul set al tatălui 
elementului i, putem asocia elementelor canonice proprietatea set [i] < 0. Prin 
această convenție, valoarea absolută a elementelor canonice poate fi oarecare. 
Atunci, de ce să nu fie chiar înălțimea arborelui? 


În concluzie, pentru reprezentarea structurii de mulțimi disjuncte, este necesar un 
singur tablou, numit set, cu tot atâtea elemente câte are şi mulțimea. Valorile 
inițiale ale elemetelor tabloului set sunt -1. Aceste inițializări vor fi realizate 
prin constructor. Interfața publică a clasei set trebuie să conțină funcţiile 
merge3 () şi find3 (), adaptate corepunzător. Tratarea situațiilor de excepție care 
pot să apară la invocarea acestor funcții (indici de mulțimi în afara intervalului 
permis) se realizează prin activarea procedurii de verificare a indicilor în tabloul 
set. 


Aceste considerente au condus la următoarele definiţii ale funcţiilor membre din 
clasa set. 


tinclude "set.h" 


set::set( int n ): set(n) | 
set.vOon( ); 
for € int Îi = 0} 1 4 né itt ) 
set[ i ] = -1; 


) 


void set::merge3( int a, int bb) { 
// sunt a si b etichete de multimi? 
if ( setl a ] >= 0 ) a = find3(a ); 
if ( seti b ] >= 0) b = find3(b ); 


// sunt multimile a si b diferite? 
if (a == b ) return; 


// reuniunea propriu-zisa 


if ( set[ a ] == set[ b ] ) set[ set[ b ] = a ]--; 
else if ( set[ a ] < set[ b ] ) set[ b ] = a; 
else setl a | = By 


return; 
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int see finds int e) { 


int r = x; 
while ( set[ r ] >= 0) 
r = set[ r |]; 
int i = Xx} 
while (i != sr) 
{ int j = set[ i ]; set[ i ] = r; i = j; ) 


return r} 


Fişierul header set .h este: 


+ifndef __SET_H 
+define __SET_H 


+include "heap.h" 


class set { 

public: 
set ( int ); 
void merge3 ( int, int ); 
int finds ( int J7 


private: 
tablou<int> set; 
); 


endif 


6.8 Cele mai scurte drumuri care pleacă din același 
punct 


Fie G= <V,M> un graf orientat, unde V este mulțimea vârfurilor şi M este 
mulțimea muchiilor. Fiecare muchie are o lungime nenegativă. Unul din vârturi 
este desemnat ca vârf sursă. Problema este să determinăm lungimea celui mai 
scurt drum de la sursă către fiecare vârf din graf. 


Vom folosi un algoritm greedy, datorat lui Dijkstra (1959). Notăm cu C mulțimea 
vârfurilor disponibile (candidaţii) şi cu S mulţimea vârfurilor deja selectate. În 
fiecare moment, S conţine acele vârfuri a căror distanță minimă de la sursă este 
deja cunoscută, în timp ce mulțimea C conţine toate celelalte vârfuri. La început, 
S conţine doar vârful sursă, iar în final S conţine toate vârfurile grafului. La 
fiecare pas, adăugăm în S acel vârf din C a cărui distanţă de la sursă este cea mai 
mică. 
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Spunem că un drum de la sursă către un alt vârf este special, dacă toate vârfurile 
intermediare de-a lungul drumului aparţin lui S. Algoritmul lui Dijkstra lucrează 
în felul următor. La fiecare pas al algoritmului, un tablou D conţine lungimea 
celui mai scurt drum special către fiecare vârf al grafului. După ce adăugăm un 
nou vârf v la S, cel mai scurt drum special către v va fi, de asemenea, cel mai scurt 
dintre toate drumurile către v. Când algoritmul se termină, toate vârfurile din graf 
sunt în S, deci toate drumurile de la sursă către celelalte vârfuri sunt speciale şi 
valorile din D reprezintă soluţia problemei. 


Presupunem, pentru simplificare, că vârfurile sunt numerotate, V = (1,2,...,n), 
vârful 1 fiind sursa, şi că matricea L dă lungimea fiecărei muchii, cu L[i, j] = +, 
dacă muchia (i, j) nu există. Soluţia se va construi în tabloul D[2 .. n]. Algoritmul 
este: 


function Dijkstra(L[1 .. n, 1..n]) 
{inițializare } 
Ce {2, 3, ... n} {S = VIC există doar implicit} 
for i — 2 to n do D[i] + L[1, i] 
{bucla greedy} 
repeat n-2 times 
v 4 vârful din C care minimizează D[v] 
CecC\fr} (şi, implicit, Se S U {v}} 
for fiecare w e C do 
Dlw] + min(D[w], D[v]+L[v, w]) 
return D 


Pentru graful din Figura 6.5, paşii algoritmului sunt prezentați în Tabelul 6.3. 


Observăm că D nu se schimbă dacă mai efectuăm o iterație pentru a-l scoate şi pe 
{2} din C. De aceea, bucla greedy se repetă de doar n—2 ori. 


Se poate demonstra următoarea proprietate: 


Figura 6.5 Un graf orientat. 
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Pasul v C D 
inițializare — {2, 3,4, 5} [50, 30, 100, 10] 
1 5 (2, 3,4) [50, 30, 20, 10] 
2 4 (2, 3) [40, 30, 20, 10] 
3 3 (2) [35, 30, 20, 10] 


Tabelul 6.3 Algoritmul lui Dijkstra aplicat grafului din Figura 6.5. 


Proprietatea 6.5. În algoritmul lui Dijkstra, dacă un vârf i 


i) este în S, atunci D[i] dă lungimea celui mai scurt drum de la sursă către i; 


ii) nu este în S, atunci D[i] dă lungimea celui mai scurt drum special de la sursă 
către i. m 


La terminarea algoritmului, toate vârfurile grafului, cu excepţia unuia, sunt în S. 
Din proprietatea precedentă, rezultă că algoritmul lui Dijkstra funcţionează 
corect. 


Dacă dorim să aflăm nu numai lungimea celor mai scurte drumuri, dar şi pe unde 
trec ele, este suficient să adăugăm un tablou P[2 .. n], unde P[v] conţine numărul 
nodului care îl precede pe v în cel mai scurt drum. Pentru a găsi drumul complet, 
nu avem decât să urmărim, în tabloul P, vârfurile prin care trece acest drum, de la 
destinaţie la sursă. Modificările în algoritm sunt simple: 


e inițializează P[i] cu 1, pentru 2 <i<n 
e conținutul buclei for cea mai interioară se înlocuieşte cu 
if D[w] > D[v]+L[v, w] then Dlw] e Dlv]+Liv, w] 
Piw] ev 
e bucla repeat se execută de n-l ori 
Să presupunem că aplicăm algoritmul Dijkstra asupra unui graf cu n vârfuri şi m 


muchii. Inițializarea necesită un timp în O(n). Alegerea lui v din bucla repeat 
presupune parcurgerea tuturor vârfurilor conținute în C la iterația respectivă, deci 


a n—l, n—2, ..., 2 vârfuri, ceea ce necesită în total un timp în O(n’). Bucla for 
interioară efectuează n—2, n—3, ..., 1 iterații, totalul fiind tot în O(n?). Rezultă că 
algoritmul Dijkstra necesită un timp în O(n”). 

Încercăm să îmbunătăţim acest algoritm. Vom reprezenta graful nu sub forma 
matricii de adiacenţă L, ci sub forma a n liste de adiacenţă, conţinând pentru 
fiecare vârf lungimea muchiilor care pleacă din el. Bucla for interioară devine 


astfel mai rapidă, deoarece putem să considerăm doar vârfurile w adiacente lui v. 
Aceasta nu poate duce la modificarea ordinului timpului total al algoritmului, 
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dacă nu reuşim să scădem şi ordinul timpului necesar pentru alegerea lui v din 
bucla repeat. De aceea, vom ţine vârfurile v din C într-un min-heap, în care 
fiecare element este de forma (v, D[v]), proprietatea de min-heap referindu-se la 
valoarea lui D[v]. Numim algoritmul astfel obţinut Dijkstra-modificar. Să îl 
analizăm în cele ce urmează. 


Iniţializarea min-heap-ului necesită un timp în O(n). Instrucţiunea “C e C\ (v)” 
constă în extragerea rădăcinii min-heap-ului şi necesită un timp în O(log n). 
Pentru cele n-—2 extrageri este nevoie de un timp în O(n log n). 


Pentru a testa dacă “D[w] > Dl[v]+Llv, w]”, bucla for interioară constă acum în 
inspectarea fiecărui vârf w din C adiacent lui v. Fiecare vârf v din C este introdus 
în S exact o dată şi cu acest prilej sunt testate exact muchiile adiacente lui; rezultă 
că numărul total de astfel de testări este de cel mult m. Dacă testul este adevărat, 
trebuie să îl modificăm pe D[w] şi să operăm un percolate cu w în min-heap, ceea 
ce necesită din nou un timp în O(log n). Timpul total pentru operaţiile percolate 
este deci în O(m log n). 


În concluzie, algoritmul  Dijkstra-modificat necesită un timp în 
O(max(n, m) log n). Dacă graful este conex, atunci m2 n şi timpul este în 
O(m log n). Pentru un graf rar este preferabil să folosim algoritmul 
Dijkstra-modificat, iar pentru un graf dens algoritmul Dijkstra este mai eficient. 


Este uşor de observat că, într-un graf G neorientat conex, muchiile celor mai 
scurte drumuri de la un vârf i la celelalte vârfuri formează un arbore parțial al 
celor mai scurte drumuri pentru G. Desigur, acest arbore depinde de alegerea 
rădăcinii i şi el diferă, în general, de arborele parțial de cost minim al lui G. 


Problema găsirii celor mai scurte drumuri care pleacă din acelaşi punct se poate 
pune şi în cazul unui graf neorientat. 


6.9 Implementarea algoritmului lui Dijkstra 


Această secțiune este dedicată implementării algoritmului Dijkstra-modificat 
pentru determinarea celor mai scurte drumuri care pleacă din același vârf. După 
cum am văzut, acest algoritm este de preferat în cazul grafurilor rare, timpul lui 
fiind în ordinul lui O(m log n), unde m este numărul de muchii, iar n numărul de 
vârfuri ale unui graf conex. 


În implementarea noastră, tipul de date “fundamental” este clasa vp 
(vârf-pondere), definită cu ocazia implementării arborilor de interclasare. Vom 
folosi această clasă pentru: 


e Min-heap-ul C format din perechi (v, d), ponderea d fiind lungimea celui mai 
scurt drum special de la vârful sursă la vârful v. 
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e Reprezentarea grafului G prin liste de adiacenţă. Pentru fiecare vârf v, 
perechea (w, 1) este muchia de lungime 1 cu extremităţile în v şi w. 


e Tabloul P, al rezultatelor. Elementul P[i], de valoare (v, d), reprezintă vârful 
v care precede vârful i în cel mai scurt drum de la vârful sursă, d fiind 
lungimea acestui drum. 


Graful G este implementat ca un tablou de liste de elemente de tip vârf-pondere. 
Tipul graf, introdus prin 


typedef tablou< lista<vp> > graf; 


este un sinonim pentru această structură. 


Definiţia de mai sus merită o clipă de atenţie, deoarece exemplifică una din 
puţinele excepţii lexicale din C++. În limbajul C++, ca şi în limbajul C, noţiunea 
de separator este inexistentă. Separarea atomilor lexicali ai limbajului 
(identificatori, operatori, cuvinte cheie, constante) prin caracterele “albe” spațiu 
sau tab este opțională. Totuşi, în typedef-ul anterior, cele două semne > trebuie 
separate, pentru a nu fi interpretate ca operatorul de decalare >>. 


Manipularea grafului G, definit ca graf G, implică fixarea unui vârf şi apoi 
operarea asupra listei asociate vârfului respectiv. Pentru o simplă parcurgere, nu 
avem decât să definim iteratorul iterator<vp> g şi să-l inițializăm cu una din 
listele de adiacenţă, de exemplu cu cea corespunzătoare vârfului 2: g = G[ 2 ];. 


Dacă w este un obiect de tip vp, atunci, prin instrucţiunea 


obiectul w va conţine, rând pe rând, toate extremităţile şi lungimile muchiilor care 
pleacă din vârful 2. 


Structura obiectului graf G asociat grafului din Figura 6.5, structură tipărită prin 


cout << G, este: 


[3] 54 10 f 4 47 100 7 1 3 20 54 ap 50 F} f 


aini a A a 
> 
. Se Se 
U 
O 
sa 


Executarea acestei instrucțiuni implică invocarea operatorilor de inserare << ai 
tuturor celor 3 clase implicate, adică vp, tablou<T> şi lista<E>. 
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Citirea grafului G se realizează prin citirea muchiilor şi inserarea lor în listele de 
adiacenţă. In acest scop, vom folosi aceeaşi clasă muchie, utilizată şi în 
implementarea algoritmului lui Kruskal: 


int n, m = 0; // Wvarfuri si tmuchii 
muchie M; 


cout << "Numarul dè VaPf UL lasa Vă 0156 >> N} 


graf G(n); 


cout << "Muchii le... 4 

while( cin >> M) 4 
// aici se poate verifica corectitudinea muchiei M 
G| M.u |.insert( vp( M.v, M.cost ) ); 
mtt; 


} 
Algoritmul Dijkstra-modificat este implementat prin funcția 


tablou<vp> Dijkstra( const grafe G; int m; int s); 


funcție care returnează tabloul tablou<vp> P (n). În lista de argumente a acestei 
funcții, m este numărul de muchii, iar s este vârful sursă. După cum am menționat, 
P[i].v (sau (int)P[i]) este vârful care precede vârful i pe cel mai scurt drum 
de la sursă către i, iar P[i].p (sau (float)P[i]) este lungimea acestui drum. De 
exemplu, pentru acelaşi graf din Figura 6.5, secvența: 


for | int s = 0 s < m} st+ i) { 
cout << "\nCele mai scurte drumuri de la varful " 
<< [e + 1) << T" sunt: n”: 
cout <4 Dijkstreal Gy ty 5 ) << Timi} 


generează rezultatele: 


Cele mai scurte drumuri de la varful 1 sunt: 
[5]: Lp O p 4 Sp 35 F i 1y 30 F 4 op 20} 
Li 10 } 


Cele mai scurte drumuri de la varful 2 sunt: 
[5]: Zi 3-378438} | le © P { 27 3-378436 9 
Zi Gos Ter | { 27 -3:3160 


Cele mai scurte drumuri de la varful 3 sunt: 
EIE 3 3-376838 j {32 SIP 07 t3 59 ) 
37 3376+38 | 
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Cele mai scurte drumuri de la varful 4 sunt: 
[5]: { 47 3.371e+38 ) [ ay 20 } { 4; 3.37e+38 } 
(1; O} ( 4; 3.37e+38 ) 


Cele mai scurte drumuri de la varful 5 sunt: 
[5]: { 57 3-376+38 ) ( 47 30 } 1 57 3-37eFř38 ) 
tS; AO Yi dp a 


unde 3.37e+38 este constanta MAXFLOAT din fişierul header <values.h>. 
MAXFLOAT este o aproximare rezonabilă pentru +œ, fiind cel mai mare număr real 
admis de calculatorul pentru care se compilează programul. 


Datele locale funcţiei Dijkstra () sunt heap-ul heap<vp> C(n + m) şi tabloul 
tablou<vp> P (n) al celor mai scurte drumuri (incluzând şi distanţele respective) 
de la fiecare din cele n vârfuri la vârful sursă. Iniţial, distanţele din P[s] sunt + 
(constanta MAXFLOAT din <values.h>), exceptând vârful s şi celelalte vârfuri 
adiacente lui s, vârfuri incluse şi în heap-ul C. Iniţializarea variabilelor P şi C 
este realizată prin secvenţa: 


vp w; 


// initializare 
for | int 1 s= 0; 1 < nè dt) 
P[I i ] = vp( s, MAXFLOAT ); 
for | iteratortvp> d = CÍ s Iy gi 5 ) 
1 Cănseri i w); Plwy] = pi s wij} 
PI S 1] pi 0 0 J3 


Se observă aici invocarea explicită a constructorului clasei vp pentru inițializarea 
elementelor tabloului P. Din păcate, inițializarea nu este directă, ci prin 
intermediul unui obiect temporar de tip vp, obiect distrus după atribuire. 
Inițializarea directă este posibilă, dacă vom completa clasa vp cu o funcție de 
genul 


vp& vp::set( int varf, float pondere ) 
{ v = varf; p = pondere; return *this; ) 


sau cu un operator 


vp& vp::operator ( )( int varf, float pondere ) 
( v = varf; p = pondere; return *this; } 


Deşi era mai natural să folosim operatorul de atribuire =, nu l-am putut folosi 
deoarece este operator binar, iar aici avem nevoie de 3 operanzi: în membrul stâng 
obiectul invocator şi în membrul drept vârful, împreună cu ponderea. Folosind 
noul operator (), secvenţa de inițializare devine mai scurtă şi mai eficientă: 
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vp w; 


// initializare 

for ( inte 1 = Qè 1 <% n ipt ) 
P[ i ]( sy MAXFLOAT )} 

for ( iterator<«vp> 9 = GI s 1]; 9(w); } 
( C.insert(w ); Plwl](s,w); ) 

PI 5 I 0r 0 ie 


Bucla greedy a funcţiei Dijkstra () 


yp v? 
float dw; 


// bucla greedy 
for (i = l i mi lz aitt) { 
C.delete_max( v ); g= G[ v |]; 
while ( g( w) ) 
if ( (float)P[ w |] > (dw = (float)P[ v ] + (float)w) ) 
C.insert( vp(w, Plw I yy di) ) J? 


se obține prin traducerea directă a descrierii algoritmului Dijkstra-modificat. 
Fiind dificil să căutăm în heap-ul C elemente (w, D[w]) după valoarea lui w, am 
inlocuit următoarele operaţii: 

i) căutarea elementului (w, D[w]) pentru un w fixat 

ii) modificarea valorii D[w] 

iii) refacerea proprietăţii de heap 

cu o simplă inserare în heap a unui nou element (w, D[w]), D[w] fiind modificat 
corespunzător. Din păcate, această simplificare poate mări heap-ul, deoarece 
există posibilitatea ca pentru fiecare muchie să fie inserat câte un nou element. 
Numărul de elemente din heap va fi însă totdeauna mai mic decât n + m. Timpul 
algoritmului rămâne în O(m log n). 


Crearea unui obiect temporar la inserarea în heap este justificată aici chiar prin 
algoritm. Conform precizărilor de mai sus, actualizarea distanțelor se realizează 
indirect, prin inserarea unui nou obiect. Să remarcăm şi înlocuirea tabloului 
redundant D cu membrul float din tabloul P. 


În final, după executarea de n-2 ori a buclei greedy, funcţia Dijkstra () trebuie 
să returneze tabloul P: 


return P; 


Dacă secvențele prezentate până acum nu vă sunt suficiente pentru a scrie funcția 
Dijkstra () şi programul de test, iată forma lor completă: 
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tinclude <iostream.h> 
include <values.h> 


tinclude "tablou.h" 
include "heap.h" 
tinclude "muchie.h" 
tinclude "lista.h" 
tinclude "vp.h" 


typedef tablou< lista<vp> > graf; 


tablou<vp> Dijkstra( const grafe G; int m, int s) { 
int n = G.size( ); // numarul de varfuri ale grafului G 


heap<vp> C( m ); 
tablouevp> P( n ); 


YD V, W // muchii 
float dw;  // distanta 


// initializare 

for 4 ine i = Qè 1L n itt ) 
Pl i ]( s, MAXFLOAT ); 

for ( iterator<«vp> g = G| s 1]; 9(w); ) 
C.ineserti w Jọ PI w | s5; w J} 

PIs I 0, 0); 


// bucla greedy 
for (i=l; i< e 1z i++) | 

C.delete_max( v ); g = G[ v ]} 

while ( g(wĒw) ) 

if ( (float)E[ w ] > ( dw = (float)Pl[l v ] + (float)w) ) 
C.insert( voi w PI w || vy du ) ) J)? 

) 
return P; 


) 


main( ) { 
int n, m = 0; // varfuri si muchii 
muchie M; 
cout. << "Numarul de varfuri, ss. "y Cin >> ñ) 
graf G( n )ș 
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cout << "Muchiile, .. "F 

while( cin >> M) { 
// aici se poate verifica corectitudinea muchiei M 
G[ M.u ].insert( vp( M.v, M.cost ) ); 
m++; 


) 


cout << "InListele de adiacenta: n"; cout << G << "n"? 


for ( int s = 0; s < n; s+ J) {q 
cout << "\nCele mai scurte drumuri de la varful " 
<< is + 1) <<" sunt: n: 
cout de Dijkstral Gy ty ŞÎ << Tha 


} 


return 0; 


6.10 Euristica greedy 


Pentru anumite probleme, se poate accepta utilizarea unor algoritmi despre care 
nu se ştie dacă furnizează soluția optimă, dar care furnizează rezultate 
“acceptabile”, sunt mai uşor de implementat şi mai eficienți decât algoritmii care 
dau soluția optimă. Un astfel de algoritm se numeşte euristic. 


Una din ideile frecvent utilizate în elaborarea algoritmilor euristici constă în 
descompunerea procesului de căutare a soluției optime în mai multe subprocese 
succesive, fiecare din aceste subprocese constând dintr-o optimizare. O astfel de 
strategie nu poate conduce întotdeauna la o soluție optimă, deoarece alegerea unei 
soluții optime la o anumită etapă poate împiedica atingerea în final a unei soluții 
optime a întregii probleme; cu alte cuvinte, optimizarea locală nu implică, în 
general, optimizarea globală. Regăsim, de fapt, principiul care stă la baza metodei 
greedy. Un algoritm greedy, despre care nu se poate demonstra că furnizează 
soluția optimă, este un algoritm euristic. 


Vom da două exemple de utilizare a algoritmilor greedy euristici. 


6.10.1 Colorarea unui graf 


Fie G = <V, M> un graf neorientat, ale cărui vârfuri trebuie colorate astfel încât 
oricare două vârfuri adiacente să fie colorate diferit. Problema este de a obține o 
colorare cu un număr minim de culori. 


Folosim următorul algoritm greedy: alegem o culoare şi un vârf arbitrar de 
pornire, apoi considerăm vârfurile rămase, încercând să le colorăm, fără a 
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schimba culoarea. Când nici un vârf nu mai poate fi colorat, schimbăm culoarea şi 
vârful de start, repetând procedeul. 


Dacă în graful din Figura 6.6 pornim cu vârful 1 şi îl colorăm în roşu, mai putem 
colora tot în roşu vârfurile 3 şi 4. Apoi, schimbăm culoarea şi pornim cu vârful 2, 
colorându-l în albastru. Mai putem colora cu albastru şi vârful 5. Deci, ne-au fost 
suficiente două culori. Dacă colorăm vârfurile în ordinea 1, 5, 2, 3, 4, atunci se 
obţine o colorare cu trei culori. 


Rezultă că, prin metoda greedy, nu obţinem decât o soluţie euristică, care nu este 
în mod necesar soluţia optimă a problemei. De ce suntem atunci interesaţi într-o 
astfel de rezolvare? Toţi algoritmii cunoscuţi, care rezolvă optim această 
problemă, sunt exponențiali, deci, practic, nu pot fi folosiți pentru cazuri mari. 
Algoritmul greedy euristic propus furnizează doar o soluţie “acceptabilă”, dar este 
simplu și eficient. 


Un caz particular al problemei colorării unui graf corespunde celebrei probleme a 
colorării hărților: o hartă oarecare trebuie colorată cu un număr minim de culori, 
astfel încât două ţări cu frontieră comună să fie colorate diferit. Dacă fiecărui vârf 
îi corespunde o ţară, iar două vârfuri adiacente reprezintă ţări cu frontieră 
comună, atunci hărții îi corespunde un graf planar, adică un graf care poate fi 
desenat în plan fără ca două muchii să se intersecteze. Celebritatea problemei 
constă în faptul că, în toate exemplele întâlnite, colorarea s-a putut face cu cel 
mult 4 culori. Aceasta în timp ce, teoretic, se putea demonstra că pentru o hartă 
oarecare este nevoie de cel mult 5 culori. Recent s-a demonstrat pe calculator 
faptul că orice hartă poate fi colorată cu cel mult 4 culori. Este prima demonstrare 
pe calculator a unei teoreme importante. 


Problema colorării unui graf poate fi interpretată şi în contextul planificării unor 
activități. De exemplu, să presupunem că dorim să executăm simultan o mulțime 
de activităţi, în cadrul unor săli de clasă. În acest caz, vârfurile grafului reprezintă 
activități, iar muchiile unesc activităţile incompatibile. Numărul minim de culori 
necesare pentru a colora graful corespunde numărului minim de săli necesare. 


" K. Appel şi W. Haken, în Færa 6.6 Un graf care va fi colorat. 
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De la 
1 3 10 11 7 25 
2 6 12 8 26 
3 9 4 20 
4 3-15 
5 18 


Tabelul 6.4 Matricea distanțelor pentru problema comis-voiajorului. 


6.10.2 Problema comis-voiajorului 


Se cunosc distanțele dintre mai multe oraşe. Un comis-voiajor pleacă dintr-un oraş 
şi doreşte să se întoarcă în acelaşi oraş, după ce a vizitat fiecare din celelalte 
orașe exact o dată. Problema este de a minimiza lungimea drumului parcurs. Şi 
pentru această problemă, toţi algoritmii care găsesc soluția optimă sunt 
exponenţiali. 


Problema poate fi reprezentată printr-un graf neorientat, în care oricare două 
vârfuri diferite ale grafului sunt unite între ele printr-o muchie, de lungime 
nenegativă. Căutăm un ciclu de lungime minimă, care să se închidă în vârful 
inițial şi care să treacă prin toate vârfurile grafului. 


Conform strategiei greedy, vom construi ciclul pas cu pas, adăugând la fiecare 
iterație cea mai scurtă muchie disponibilă cu următoarele proprietăți: 


e nu formează un ciclu cu muchiile deja selectate (exceptând pentru ultima 
muchie aleasă, care completează ciclul) 


e nu există încă două muchii deja selectate, astfel încât cele trei muchii să fie 
incidente în același vârf 


De exemplu, pentru șase oraşe a căror matrice a distanțelor este dată în Tabelul 
6.4, muchiile se aleg în ordinea: (1, 2), (3, 5}, (4, 5), (2, 3), (14,6), (1,6) şi se 
obţine ciclul (1, 2, 3, 5, 4,6, 1) de lungime 58. Algoritmul greedy nu a găsit 
ciclul optim, deoarece ciclul (1, 2, 3, 6, 4, 5, 1) are lungimea 56. 


6.11 Exerciţii 


6.1 Presupunând că există monezi de: 
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i) 1, 5, 12 şi 25 de unităţi, găsiți un contraexemplu pentru care algoritmul 
greedy nu găseşte soluţia optimă; 

ii) 10 şi 25 de unităţi, găsiți un contraexemplu pentru care algoritmul greedy nu 
găseşte nici o soluţie cu toate că există soluţie. 


6.2 Presupunând că există monezi de: 
ol -1 
k, k,n... k” 


unități, pentru ke N, k> 1 oarecare, arătați că metoda greedy dă mereu soluția 
optimă. Consideraţi că n este un număr finit şi că din fiecare tip de monedă există 
o cantitate nelimitată. 


6.3 Pe o bandă magnetică sunt n programe, un program i de lungime l, fiind 
apelat cu probabilitatea p, 1 <i < n, pytpor...+p, > 1. Pentru a citi un program, 
trebuie să citim banda de la început. În ce ordine să memorăm programele pentru 
a minimiza timpul mediu de citire a unui program oarecare? 


Indicație: Se pun în ordinea descrescătoare a rapoartelor p; / L; 


6.4 Analizaţi eficiența algoritmului greedy care planifică ordinea clienților 
într-o stație de servire, minimizând timpul mediu de aşteptare. 


6.5 Pentru un text format din n litere care apar cu frecvențele fi fo -> fp 


demonstrați că arborele de codificare Huffman minimizează lungimea externă 
ponderată pentru toți arborii de codificare cu vârfurile terminale având valorile 


EA PRR Tas 
6.6 Câţi biţi ocupă textul “ABRACADABRA” după codificarea Huffman? 


6.7 Ce se întâmplă când facem o codificare Huffman a unui text binar? Ce se 
întâmplă când facem o codificare Huffman a unui text format din litere care au 
aceeași frecvență? 


6.8 Elaboraţi algoritmul de compactare Huffman a unui şir de caractere. 


6.9 Elaboraţi algoritmul de decompactare a unui şir de caractere codificat 
prin codul Huffman, presupunând că se cunosc caracterele şi codificarea lor. 
Folosiţi proprietatea că acest cod este de tip prefix. 
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6.10 Pe lângă codul Huffman, vom considera aici şi un alt cod celebru, care nu 
se obține însă printr-o metodă greedy, ci printr-un algoritm recursiv. 


Un cod Gray este o secvenţă de 2” elemente astfel încât: 


i) fiecare element este un șir de n biţi 
ii) oricare două elemente sunt diferite 


iii) oricare două elemente consecutive diferă exact printr-un bit (primul element 
este considerat succesorul ultimului element) 


Se observă că un cod Gray nu este de tip prefix. Elaboraţi un algoritm recursiv 
pentru a construi codul Gray pentru orice n dat. Gândiţi-vă cum ați putea utiliza 
un astfel de cod. 


Indicaţie: Pentru n = 1 putem folosi secvenţa (0, 1). Presupunem că avem un cod 
Gray pentru n-l, unde n > 1. Un cod Gray pentru n poate fi construit prin 
concatenarea a două subsecvenţe. Prima se obține prefixând cu 0 fiecare element 
al codului Gray pentru n-l. A doua se obţine citind în ordine inversă codul Gray 
pentru n-l şi prefixând cu 1 fiecare element rezultat. 


6.11 Demonstraţi că graful parţial definit ca arbore parțial de cost minim este 
un arbore. 


Indicaţie: Arătaţi că orice graf conex cu n vârfuri are cel puţin n-l muchii şi 
revedeţi Exercițiul 3.2. 


6.12 Dacă în algoritmul lui Kruskal reprezentăm graful nu printr-o listă de 
muchii, ci printr-o matrice de adiacenţă, care conţine costurile muchiilor, ce se 
poate spune despre timp? 


6.13 Ce se întâmplă dacă rulăm algoritmul i) Kruskal, ii) Prim pe un graf 
neconex? 


6.14 Ce se întâmplă în cazul algoritmului: i) Kruskal, ii) Prim dacă permitem 
muchiilor să aibă cost negativ? 


6.15 Să presupunem că am găsit arborele parţial de cost minim al unui graf G. 
Elaboraţi un algoritm de actualizare a arborelui parţial de cost minim, după ce am 
adăugat în G un nou vârf, împreună cu muchiile incidente lui. Analizaţi algoritmul 
obţinut. 
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6.16 În graful din Figura 6.5, găsiți pe unde trec cele mai scurte drumuri de la 
vârful 1 către toate celelalte vârfuri. 


6.17 Scrieți algoritmul greedy pentru colorarea unui graf şi analizaţi eficiența 
lui. 


6.18 Ce se întâmplă cu algoritmul greedy din problema comis-voiajorului dacă 
admitem că pot exista două orașe fără legătură directă între ele? 


6.19 Scrieți algoritmul greedy pentru problema comis-voiajorului şi analizaţi 
eficienţa lui. 


6.20 Într-un graf orientat, un drum este hamiltonian dacă trece exact o dată 
prin fiecare vârf al grafului, fără să se întoarcă în vârful inițial. Fie G un graf 
orientat, cu proprietatea că între oricare două vârfuri există cel puţin o muchie. 
Arătaţi că în G există un drum hamiltonian şi elaboraţi algoritmul care găseşte 
acest drum. 


6.21 Este cunoscut că orice număr natural i poate fi descompus în mod unic 
într-o sumă de termeni ai şirului lui Fibonacci (teorema lui Zeckendorf). Dacă 
prin k >> m notăm k > m+2, atunci 


i = fe tfre to fr 
unde 
ki >> k, >... >>k,>>0 


In acestă reprezentare Fibonacci a numerelor, singura valoare posibilă pentru f, 
1 
este cel mai mare termen din șirul lui Fibonacci pentru care f, < i; singura 
valoare posibilă pentru f, este cel mai mare termen pentru care f} Si— fp etc. 
2 


Reprezentarea Fibonacci a unui număr nu conţine niciodată doi termeni 
consecutivi ai şirului lui Fibonacci. 


Pentru 0<is</f,-l, n23, numim codificarea Fibonacci de ordinul n al lui i 


secvenţa de biţi b, ,, by ---» B2, unde 


n-—l 
i=} b;f; 
j=2 
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este reprezentarea Fibonacci a lui i. De exemplu, pentru i = 6, codificarea de 
ordinul 6 este 1001, iar codificarea de ordinul 7 este 01001. Se observă că în 
codificarea Fibonacci nu apar doi de 1 consecutiv. 


Daţi un algoritm pentru determinarea codificării Fibonacci de ordinul n al lui i, 
unde n şi i sunt oarecare. 


6.22 Codul Fibonacci de ordinul n, n > 2, este secvența C, a celor f, codificări 
Fibonacci de ordinul n ale lui į, atunci când i ia toate valorile 0 < i < f,—1. De 
exemplu, dacă notăm cu À șirul nul, obținem: C,= (A), C,= (0, 1), 
C, = (00, 01, 10), C; = (000, 001, 010, 100, 101) etc. Elaborați un algoritm 


recursiv care construieşte codul Fibonacci pentru orice n dat. Gândiţi-vă cum ați 
putea utiliza un astfel de cod. 


Indicație: Arătați că putem construi codul Fibonacci de ordinul n, n > 4, prin 
concatenarea a două subsecvențe. Prima subsecvență se obține prefixând cu 0 
fiecare codificare din C,_,. A doua subsecvență se obține prefixând cu 10 fiecare 


codificare din C,_p. 


7. Algoritmi divide et 
impera 


7.1 Tehnica divide et impera 


Divide et impera este o tehnică de elaborare a algoritmilor care constă în: 


e  Descompunerea cazului ce trebuie rezolvat într-un număr de subcazuri mai 
mici ale aceleiaşi probleme. 


e Rezolvarea succesivă și independentă a fiecăruia din aceste subcazuri. 
e Recompunerea subsoluţiilor astfel obţinute pentru a găsi soluţia cazului iniţial. 


Să presupunem că avem un algoritm A cu timp pătratic. Fie c o constantă, astfel 
încât timpul pentru a rezolva un caz de mărime n este t¿(n) < cn’. Să presupunem 
că este posibil să rezolvăm un astfel de caz prin descompunerea în trei subcazuri, 
fiecare de mărime |n/2|. Fie d o constantă, astfel încât timpul necesar pentru 
descompunere şi recompunere este t(n) < dn. Folosind vechiul algoritm şi ideea de 


descompunere-recompunere a subcazurilor, obținem un nou algoritm B, pentru 
care: 


ta(n) = 3t, (n 2 run) < 3e((n+1)/2)7+dn = 3/4cn?°+(3/2+d)n+3/4c 


2 si iai ro că ST 
Termenul 3/4cn° domină pe ceilalți când n este suficient de mare, ceea ce 
înseamnă că algoritmul B este în esență cu 25% mai rapid decât algoritmul A. Nu 
am reuşit însă să schimbăm ordinul timpului, care rămâne pătratic. 


Putem să continuăm în mod recursiv acest procedeu, împărțind subcazurile în 
subsubcazuri etc. Pentru subcazurile care nu sunt mai mari decât un anumit prag 
Nng, vom folosi tot algoritmul A. Obţinem astfel algoritmul C, cu timpul 


Rs ta(n) pentru n< no 
E 3te(ln/2)+t(n) pentru n > no 


lg 3 


Conform rezultatelor din Secțiunea 5.3.5, fc(n) este în ordinul lui n * . Deoarece 


lg 3 = 1,59, înseamnă că de această dată am reuşit să îmbunătăţim ordinul 
timpului. 


Iată o descriere generală a metodei divide et impera: 
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function divimp(x) 
{returnează o soluție pentru cazul x) 
if x este suficient de mic then return adhoc(x) 


(descompune x în subcazurile x,, X3, ..., Xg} 

for i — 1 to k do y, — divimp(x;) 

trecompune y,, Y2, --- Y în scopul obţinerii soluţiei y pentru x) 
return y 


unde adhoc este subalgoritmul de bază folosit pentru rezolvarea micilor subcazuri 
ale problemei în cauză (în exemplul nostru, acest subalgoritm este A). 


Un algoritm divide et impera trebuie să evite descompunerea recursivă a 
subcazurilor “suficient de mici”, deoarece, pentru acestea, este mai eficientă 
aplicarea directă a subalgoritmului de bază. Ce înseamnă însă “suficient de mic”? 


In exemplul precedent, cu toate că valoarea lui nọ nu influențează ordinul 


: . . Să _ . . Ce) . lg 3 
timpului, este influenţată însă constanta multiplicativă a lui n”, ceea ce poate 


avea un rol considerabil în eficienţa algoritmului. Pentru un algoritm divide et 
impera oarecare, chiar dacă ordinul timpului nu poate fi îmbunătățit, se doreşte 
optimizarea acestui prag în sensul obţinerii unui algoritm cât mai eficient. Nu 
există o metodă teoretică generală pentru aceasta, pragul optim depinzând nu 
numai de algoritmul în cauză, dar şi de particularitatea implementării. 
Considerând o implementare dată, pragul optim poate fi determinat empiric, prin 
măsurarea timpului de execuţie pentru diferite valori ale lui n, şi cazuri de mărimi 


diferite. 


In general, se recomandă o metodă hibridă care constă în: i) determinarea 
teoretică a formei ecuaţiilor recurente; ii) găsirea empirică a valorilor 
constantelor folosite de aceste ecuaţii, în funcţie de implementare. 


Revenind la exemplul nostru, pragul optim poate fi găsit rezolvând ecuaţia 


ta(n) = 3t (n 2 + tn) 


Empiric, găsim nọ = 67, adică valoarea pentru care nu mai are importanță dacă 


aplicăm algoritmul A în mod direct, sau dacă continuăm descompunerea. Cu alte 
cuvinte, atâta timp cât subcazurile sunt mai mari decât nọ, este bine să continuăm 


descompunerea. Dacă continuăm însă descompunerea pentru subcazurile mai mici 
decât nọ, eficienţa algoritmului scade. 


Observăm că metoda divide et impera este prin definiție recursivă. Uneori este 
posibil să eliminăm recursivitatea printr-un ciclu iterativ. Implementată pe o 
maşină convenţională, versiunea iterativă poate fi ceva mai rapidă (în limitele 
unei constante multiplicative). Un alt avantaj al versiunii iterative ar fi faptul că 
economisește spaţiul de memorie. Versiunea recursivă folosește o stivă necesară 
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memorării apelurilor recursive. Pentru un caz de mărime n, numărul apelurilor 
recursive este de multe ori în Q(log n), uneori chiar în O(n). 


7.2 Căutarea binară 


Căutarea binară este cea mai simplă aplicaţie a metodei divide et impera, fiind 
cunoscută încă înainte de apariţia calculatoarelor. In esenţă, este algoritmul după 
care se caută un cuvînt într-un dicţionar, sau un nume în cartea de telefon. 


Fie T[l ..n] un tablou ordonat crescător şi x un element oarecare. Problema 
constă în a-l găsi pe x în T, iar dacă nu se află acolo în a găsi poziţia unde poate fi 
inserat. Căutăm deci indicele i astfel încât 1 <<i<n şi T[i] <x < T[i+1], cu 
convenţia 7[0] = —co, T[n+1] = +oo. Cea mai evidentă metodă este căutarea 
secvenţială: 


function sequential(T{1 .. n], x) 
(caută secvențial pe x în tabloul T } 
for i — 1 ton do 

if T[i] > x then return i-l 
return n 


Algoritmul necesită un timp în O(l+r), unde r este indicele returnat; aceasta 
înseamnă ©(1) pentru cazul cel mai favorabil şi 0(n) pentru cazul cel mai 
nefavorabil. Dacă presupunem că elementele lui 7 sunt distincte, că x este un 
element al lui 7 şi că se află cu probabilitate egală în oricare poziţie din 7, atunci 


bucla for se execută în medie de (n?+3n—2)/2n ori. Timpul este deci în O(n) şi 
pentru cazul mediu. 


Pentru a mări viteza de căutare, metoda divide et impera sugerează să-l căutăm pe 
x fie în prima jumătate a lui T, fie în cea de-a doua. Comparându-l pe x cu 
elementul din mijlocul tabloului, putem decide în care dintre jumătăţi să căutăm. 
Repetând recursiv procedeul, obţinem următorul algoritm de căutare binară: 


function binsearch(T[l .. n], x) 
(caută binar pe x în tabloul T} 
if n = 0 or x < T[1] then return O 
return binrec(T{1 .. n], x) 
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function binrec(T|i .. j], x) 
(caută binar pe x în subtabloul T[i .. j]; această procedură 
este apelată doar când T[i] < x < T[j+1] şi i <j) 
if i = j then return i 
k — (i+j+1) div 2 
if x< T[k] then return binrec(T|i .. k-1], x) 
else return binrec(T[k .. j], x) 


Algoritmul binsearch necesită un timp în O(log n), indiferent de poziţia lui x în 7 
(demonstrați acest lucru, revăzând Secţiunea 5.3.5). Procedura binrec execută 
doar un singur apel recursiv, în funcţie de rezultatul testului “x < 7[k]”. Din 
această cauză, căutarea binară este, mai curând, un exemplu de simplificare, decât 
de aplicare a tehnicii divide et impera. 


Iată şi versiunea iterativă a acestui algoritm: 


function irerbinI (TI .. n], x) 

(căutare binară iterativă) 
if n = 0 or x < T[1] then return O 
ie l;jen 
while i < j do 

TUI] <x < T7[j+1]) 

k — (i+j+1) div 2 

if x < T[k] then j< k-1 

else i< k 

return i 


Acest algoritm de căutare binară pare ineficient în următoarea situaţie: dacă la un 
anumit pas avem x = T[k], se continuă totuşi căutarea. Următorul algoritm evită 
acest inconvenient, oprindu-se imediat ce găseşte elementul căutat. 


function iterbin2(T[1 .. n], x) 
(variantă a căutării binare iterative) 
if n = 0 or x < T[1] then return 0 
ie l;jen 
while į < j do 

T[i] < x < T[j+1]} 
k — (i+j) div 2 
case x<T[k]:jek-l 
x > T[k+1]: i< k+1 
otherwise: i, j<«— k 
return i 


Timpul pentru iterbinl este în O(log n). Algoritmul irerbin2 necesită un timp care 
depinde de poziţia lui x în T, fiind în O(1), O(log n), O(log n) pentru cazurile cel 
mai favorabil, mediu şi respectiv, cel mai nefavorabil. 
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Care din aceşti doi algoritmi este oare mai eficient? Pentru cazul cel mai 
favorabil, iterbin2 este, evident, mai bun. Pentru cazul cel mai nefavorabil, 
ordinul timpului este acelaşi, numărul de executări ale buclei while este același, 
dar durata unei bucle while pentru irerbin2 este ceva mai mare; deci iterbinl este 
preferabil, având constanta multiplicativă mai mică. Pentru cazul mediu, 
compararea celor doi algoritmi este mai dificilă: ordinul timpului este acelaşi, o 
buclă while în iferbinl durează în medie mai puţin decât în iterbin2, în schimb 
iterbinl execută în medie mai multe bucle while decât iterbin2. 


7.3  Mergesort (sortarea prin interclasare) 


Fie T[1 .. n] un tablou pe care dorim să-l sortăm crescător. Prin tehnica divide et 
impera putem proceda astfel: separăm tabloul T în două părți de mărimi cât mai 
apropiate, sortăm aceste părţi prin apeluri recursive, apoi interclasăm soluţiile 
pentru fiecare parte, fiind atenţi să păstrăm ordonarea crescătoare a elementelor. 
Obţinem următorul algoritm: 


procedure mergesort(T[1 .. n]) 
(sortează în ordine crescătoare tabloul T} 
if n este mic 
then insert(T) 
else arrays U[1 .. n div 2], V[1 .. (n+1) div 2] 
U & T[1 .. n div 2] 
V & T[1 + (n div 2)..n] 
mergesort(U); mergesort(V) 
merge(T, U, V) 


unde insert(T) este algoritmul de sortare prin inserție cunoscut, iar merge(T, U, V) 
interclasează într-un singur tablou sortat 7 cele două tablouri deja sortate U şi V. 


Algoritmul mergesort ilustrează perfect principiul divide et impera: pentru n 
având o valoare mică, nu este rentabil să apelăm recursiv procedura mergesort, ci 
este mai bine să efectuăm sortarea prin inserţie. Algoritmul insert lucrează foarte 
bine pentru n < 16, cu toate că, pentru o valoare mai mare a lui n, devine 
neconvenabil. Evident, se poate concepe un algoritm mai puţin eficient, care să 
meargă până la descompunerea totală; în acest caz, mărimea stivei este în 
O(log n). 


Spaţiul de memorie necesar pentru tablourile auxiliare U şi V este în O(n). Mai 


precis, pentru a sorta un tablou de n = 2% elemente, presupunând că 
descompunerea este totală, acest spaţiu este de 


2(251 +2% ee o ae 7104350 00 =2n 
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elemente. 


Putem considera (conform Exerciţiului 7.7) că algoritmul merge(T, U, V) are 
timpul de execuţie în O(4U + #V), indiferent de ordonarea elementelor din U şi V. 
Separarea lui T în U şi V necesită tot un timp în ©(#U + #V). Timpul necesar 
algoritmului mergesort pentru a sorta orice tablou de n elemente este atunci 
t(n) e t(ln/2 D+ n2h+e(m. Această ecuație, pe care am analizat-o în Secțiunea 
5.1.2, ne permite să conchidem că timpul pentru mergesort este în O(n log n). Să 
reamintim timpii celorlalți algoritmi de sortare, algoritmi analizați în Capitolul 5: 
pentru cazul mediu şi pentru cazul cel mai nefavorabil insert şi select necesită un 
timp în O(n’), iar heapsort un timp în O(n log n). 


În algoritmul mergesort, suma mărimilor subcazurilor este egală cu mărimea 
cazului iniţial. Această proprietate nu este în mod necesar valabilă pentru 
algoritmii divide et impera. Oare de ce este însă important ca subcazurile să fie de 
mărimi cât mai egale? Dacă în mergesort îl separăm pe T în tabloul U având n-l 
elemente şi tabloul V având un singur element, se obţine (Exerciţiul 7.9) un nou 


. A 2) E m . 
timp de execuție, care este în O(n). Deducem de aici că este esențial ca 
subcazurile să fie de mărimi cât mai apropiate (sau, alfel spus, subcazurile să fie 
cât mai echilibrate). 


7.4 Mergesort în clasele tablou<T> şi lista<E> 


7.4.1 O soluție neinspirată 


Deşi eficient în privința timpului, algoritmul de sortare prin interclasare are un 
handicap important în ceea ce priveşte memoria necesară. Într-adevăr, orice 
tablou de n elemente este sortat într-un timp în O(n log n), dar utilizând un spațiu 
suplimentar de memorie” de 2n elemente. Pentru a reduce consumul de memorie, 
în implementarea acestui algoritm nu vom utiliza variabilele intermediare U şi V 
de tip tablou<T>, ci o unică zonă de auxiliară de n elemente. 


Convenim să implementăm procedura mergesort din Secțiunea 7.3 ca membru 
private al clasei parametrice tablou<T>. Invocarea acestei proceduri se va 
realiza prin funcția membră 


Spațiul suplimentar utilizat de algoritmul mergesort poate fi independent de numărul elementelor 
tabloului de sortat. Detaliile de implementare a unei astfel de strategii se găsesc în D. E. Knuth, 
“Tratat de programarea calculatoarelor. Sortare şi căutare”, Secţiunea 5.2.4. 
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P] 
Y 


template <class T> 
tablou<T>g tablouc<T>: sorti } { 


T *aux = new T[ d ]; // alocarea zonei de interclasare 
mergesort ( 0, d; aux ); // si sortarea propriu-zisa 
delete | ] aux; // eliberarea zonei alocate 


return *this; 
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Am preferat această manieră de “încapsulare” din următoarele două motive: 


e Alocarea şi eliberarea spaţiului suplimentar necesar interclasării se face o 
singură dată, înainte şi după terminarea sortării. Funcţia mergesort (), ca 
funcţie recursivă, nu poate avea controlul asupra alocării şi eliberării acestei 
zone. 


e Algoritmul mergesort are trei parametri care pot fi ignoraţi la apelarea funcţiei 
de sortare. Aceştia sunt: adresa zonei suplimentare de memorie şi cei doi indici 
prin care se încadrează elementele de sortat din tablou. 


După cum se poate vedea în Exerciţiul 7.7, implementarea interclasării se 
simplifică mult prin utilizarea unor valori “santinelă” în tablourile de interclasat. 
Funcţia mergesort (): 


template <class T> 
void tablou<T>::mergesort ( int st, int dr, T*x) { 
VE (de gt e ijf 
// mijlocul intervalului 
int m = (| st + dr) 4 27 


// sortarea celor doua parti 
mergesort ( st, m); 
mergesort (m, dr ); 


// pregatirea zonei x pentru interclasare 
ine k = BË; 

for ( int i = stș L< m: | xL itt |] 
for | int J gr; J > mi | xi == ] 


al k++ ]; 
al k++ ]; 


// interclasarea celor doua parti din x in zona a 
d = gt; J] = ar = I; 

for ( k = stè k < dr? ktt ) 

alk | = a[i J1] e I 19 gi tr Je al 15 


se adaptează surprinzător de simplu la utilizarea “santinelelor”. Nu avem decât să 
transferăm în zona auxiliară cele două jumătăți deja sortate, astfel încât valorile 
maxime să fie la mijlocul acestei zone. Altfel spus, prima jumătate va fi 
transferată crescător, iar cea de-a doua descrescător, în continuarea primei 
jumătăți. Începând interclasarea cu valorile minime, valoarea maximă din fiecare 
jumătate este santinelă pentru cealaltă jumătate. 


Sortarea prin interclasare prezintă un avantaj foarte important față de alte metode 
de sortare deoarece elementele de sortat sunt parcurse secvențial, element după 
element. Din acest motiv, metoda este potrivită pentru sortarea fişierelor sau 


listelor. De exemplu, procedura de sortare prin interclasare a obiectelor de tip 
lista<E> 
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template <class E> 
lista<E>s lista<E>::sort () | 
if ( head ) 
head = mergesort ( head ); 


return *thisy 


rearanjează nodurile în ordinea crescătoare a cheilor, fără a folosi noduri sau liste 
temporare. Preţul în spaţiu suplimentar de memorie este totuşi plătit, deoarece 
orice listă înlănţuită necesită memorie în ordinul numărului de elemente pentru 
realizarea înlănţuirii. 


Conform algoritmului mergesort, lista se împarte în două parți egale, iar după 
sortarea fiecăreia se realizează interclasarea. Împărţirea listei în cele două părți 
egale nu se poate realiza direct, ca în cazul tablourilor, ci în mai mulți paşi. 
Astfel, vom parcurge lista până la sfârșit, pentru a putea determina elementul din 
mijloc. Apoi stabilim care este elementul din mijloc şi, în final, izolăm cele două 
părţi, fiecare în câte o listă. În funcţia mergesort (): 


template <class E> 


nod<E>* mergesort ( nod<E> *c ) { 
if ( e 6& c-onezt >) { 
// sunt cel putin doua noduri in lista 
mod<E> fa = c; *Bj 


for ( b = c->next; b; a = a->next ) 
if ( b->next ) b = b->next->next; 
else break; 
b = a->next; a->next = 0; 
return merge( mergesort( c ), mergesort(b ) ); 
) 


else 
// lista contine cel mult un nod 
return qi 


împărţirea listei se realizează printr-o singură parcurgere, dar cu două adrese de 
noduri, a şi b. Principiul folosit este următorul: dacă b înaintează în parcurgerea 
listei de două ori mai repede decât a, atunci când b a ajuns la ultimul nod, a este 
la nodul de mijloc al listei. 


Spre deosebire de algoritmul mergesorz, sortarea listelor prin interclasare nu 
deplasează valorile de sortat. Funcţia merge () interclasează listele de la adresele 
a şi b prin simpla modificare a legăturilor nodurilor. 
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template <class E> 
nod<E>* merge( nod<E> *a, nod<E> *b ) { 
nod<E> *head; // primul nod al listei interclasate 


if (a && b) 

// ambele liste sunt nevide; 

// stabilim primul nod din lista interclasata 

if (a->val > b->val ) ( head = b; b = b->next; ) 

else ( head = a; a = a->next; ) 
else 

// cel putin una din liste este vida; 

// nu avem ce interclasa 

return a? a: b} 


// interclasarea propriu-zisa 


nod<E> *c = head; // ultimul nod din lista interclasata 
while (a && b ) 
if | a->val > b->val ) | e>next p: g b; b b->next; } 
else { c->next a c a; a a->next; } 


// cel putin una din liste s-a epuizat 
c->next = a? a: b; 


// se returneaza primul nod al listei interclasate 
return head; 


Funcția de sortare mergesort (), împreună cu cea de interclasare merge (), 
lucrează exclusiv asupra nodurilor. Deoarece aceste funcții sunt invocate doar la 
nivel de listă, ele nu sunt membre în clasa nod<E>, ci doar friend față de această 


clasă. Încapsularea lor este realizată prin mecanismul standard al limbajului C++. 
Deşi aceste funcții aparțin domeniului global, ele nu pot fi invocate de aici 
datorită obiectelor de tip nod<E>, obiecte accesibile doar din domeniul clasei 
lista<E>. Această manieră de încapsulare nu este complet sigură, deoarece, chiar 
dacă nu putem manipula obiecte de tip nod<E>, totuşi putem lucra cu adrese de 
nod<E>. De exemplu, funcția 


void £i ) 4 
mergesort ( (nod<int> *)0 ); 


) 


“trece” de compilare, dar efectele ei la rularea programului sunt imprevizibile. 


Prezenţa funcţiilor de sortare în tablou<T> şi lista<E> (de fapt şi în nod<E>) 
impune completarea claselor T şi E cu operatorul de comparare >. Orice tentativă 
de a defini (atenţie, de a defini şi nu de a sorta) obiecte de tip tablou<T> sau 
lista<E> este semnalată ca eroare de compilare, dacă tipurile T sau E nu au 
definit acest operator. Situaţia apare, deoarece generarea unei clase parametrice 


implică generarea tuturor funcţiilor membre. Deci, chiar dacă nu invocăm funcţia 
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de sortare pentru tipul tablou<T>, ea este totuşi generată, iar generarea ei 
necesită operatorul de comparare al tipului T. 


De exemplu, pentru a putea lucra cu liste de muchii, lista<muchie>, sau tablouri 
de tablouri, tablou< tablou<T> >, vom implementa operatorii de comparare 
pentru clasa muchie şi clasa tablou<T>. Muchiile sunt comparate în funcţie de 
costul lor, dar cum vom proceda cu tablourile? O soluţie este de a lucra conform 
ordinii lexicografice, adică de a aplica aceeași metodă care se aplică la ordonarea 
numelor în cartea de telefoane, sau în catalogul şcolar: 


template <class T> 


operator > ( const tablou<T>& a, const tablou<T>s b) [| 
// minumul elementelor 
int as = a.size( ), bs = b.size(); 


INC n = as < be? ast base 


// comparam pana la prima diferenta 
far | int 1 = 0; 1 < ñ it) 
1€ (al iI >= bI aL] ) return al i] > pl i J} 


// primele n elemente sunt identice 
return as > bs; 


Atunci când operatorii de comparare nu prezintă interes, sau nu pot fi definiți, îi 
putem implementa ca funcţii inefective. Astfel, dacă avem nevoie de un tablou de 
liste sau de o listă de liste asupra cărora nu vom aplica operaţii de sortare, va 
trebui să definim operatorii inefectivi: 


template <class E> 
operator >( const lista<E>&, const lista<E>& ) { 
return 1; 


) 


În concluzie, extinderea claselor tablou<T> şi lista<E> cu funcţiile de sortare 
nu menţine compatibilitatea acestor clase faţă de aplicaţiile dezvoltate până acum. 
Oricând este posibil ca recompilarea unei aplicaţii în care se utilizează, de 
exemplu, tablouri sau liste cu elemente de tip XA, XB etc, să devină un coșmar, 
deoarece, chiar dacă nu are nici un sens, trebuie să completăm fiecare clasă XA, XB 
etc, cu operatorul de comparare >. 


Programarea orientată pe obiect se foloseşte tocmai pentru a evita astfel de 
situaţii, nu pentru a le genera. 
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7.4.2 Tablouri sortabile şi liste sortabile 


Sortarea este o operaţie care completează facilităţile clasei tablou<T>, fără a 
exclude utilizarea acestei clase pentru tablouri nesortabile. Din acest motiv, 
funcţiile de sortare nu pot fi funcții membre în clasa tablou<T>. 


O soluţie posibilă de încapsulare a sortării este de a construi, prin derivare 
publică din tablou<T>, subtipul tablousortabil<T>, care să conţină tot ceea ce 
este necesar pentru sortare. Mecanismului standard de conversie, de la tipul 
derivat public la tipul de bază, permite ca un tablousortabil<T> să poată fi 
folosit oricând în locul unui tablou<T>. 


In continuare, vom prezenta o altă variantă de încapsulare, mai puţin clasică, prin 
care atributul “sortabil” este considerat doar în momentul invocării funcției de 
sortatre, nu apriori, prin definirea obiectului ca “sortabil”. 


Sortarea se invocă prin funcţia 


template <class T> 

tablou<T>& mergesort ( tablou<T>& t ) { 
| tmsort<T> )E? 
return ty 


} 


care constă în conversia tabloului t la tipul tmsort<T>. Clasa tmsort<T> 
încapsulează absolut toate detaliile sortării. Fiind vorba de sortarea prin 
interclasare, detaliile de implementare sunt cele stabilite în Secțiunea 7.4.1. 


template <class T> 
class tmsort { 
publice: 

tmsort ( tablou<T>& ); 


private: 
T ta; // adresa zonei de sortat 
T *x;  // zona auxiliara de interclasare 


void mergesort ( int, int ); 


); 


Sortarea, de fapt transformarea tabloului t într-un tablou sortat, este realizată prin 
constructorul 
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template <class T> 


tmsort=T>: stmsort | tablou<T>s È ): a ta) | 
x = new TI t.size() ]; // alocarea zonei de interclasare 
mergesort ( 0, t.size() ); // sortarea 
delete [ ] x; // eliberarea zonei alocate 


) 


După cum se observă, în acest constructor se foloseşte membrul privat T *a 
(adresa zonei alocate elementelor tabloului) din clasa tablou<T>. lată de ce, în 
clasa tablou<T> trebuie făcută o modificare (singura dealtfel): clasa tmsort<T> 
trebuie declarată friend. 


Funcţia mergesort () este practic neschimbată: 


template <class T> 
void tmsort<T>::mergesort ( int st, int dr ) 1 
TE ass 
// corpul functiei void mergesort( int; int; T* ) 
// din Sectiunea 7.4.1. 
// 


Pentru sortarea listelor se procedează analog, transformând implementarea din 
Secţiunea 7.4.1 în cea de mai jos. 


template <class E> 

lista<E>& mergesort ( lista<E>& 1) { 
( Imsort<E> )l1} 
return 1; 


) 


template <class E> 

class Ilmsort | 

publie: 
Imsort ( lista<E>& ); 


private: 
nod<E>* mergesort ( nod<E>* ); 
nod<E>* merge( nod<E>*, nod<E>* ); 
); 


template <class E> 
Imsort<E>::lmsort ( lista<E>s 1) { 
if ( l.head ) 
1.head = mergesort( l.head ); 
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template <class E> 
nod<E>* Imsort<E>::mergesort ( nod<k> *c) { 
// 
// corpul functiei nod<E>* mergesort ( nod<E>* ) 
J} din Sectiunea 7.4.1. 
íz 


} 


template <class E> 
nod<E>* lmsort<E>::merge( nod<E> *a, nod<E> *b ) { 
ft 
// corpul functiei nod<E>* merge( nod<E>*, nod<E>* ) 
// din Sectiunea 7.4.1. 
fz 


Nu uitaţi de declarația friend! Clasa Imsort<E> foloseşte membrii privați atât 
din clasa lista<E>, cât şi din clasa nod<E>, deci trebuie declarată friend în 
ambele. 


7.5  Quicksort (sortarea rapidă) 


Algoritmul de sortare quicksort, inventat de Hoare în 1962, se bazează de 
asemenea pe principiul divide et impera. Spre deosebire de mergesort, partea 
nerecursivă a algoritmului este dedicată construirii subcazurilor şi nu combinării 
soluţiilor lor. 


Ca prim pas, algoritmul alege un element pivot din tabloul care trebuie sortat. 
Tabloul este apoi partiționat în două subtablouri, alcătuite de-o parte şi de alta a 
acestui pivot în următorul mod: elementele mai mari decât pivotul sunt mutate în 
dreapta pivotului, iar celelalte elemente sunt mutate în stânga pivotului. Acest 
mod de partiționare este numit pivotare. În continuare, cele două subtablouri sunt 
sortate în mod independent prin apeluri recursive ale algoritmului. Rezultatul este 
tabloul complet sortat; nu mai este necesară nici o interclasare. Pentru a echilibra 
mărimea celor două subtablouri care se obțin la fiecare partiționare, ar fi ideal să 
alegem ca pivot elementul median. Intuitiv, mediana unui tablou T este elementul 
m din T, astfel încât numărul elementelor din T mai mici decât m este egal cu 
numărul celor mai mari decât m (o definiţie riguroasă a medianei unui tablou este 
dată în Secţiunea 7.6). Din păcate, găsirea medianei necesită mai mult timp decât 
merită. De aceea, putem pur şi simplu să folosim ca pivot primul element al 
tabloului. Iată cum arată acest algoritm: 
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procedure guicksort(T|i .. j]) 
(sortează în ordine crescătoare tabloul T[i .. j]) 
if j-i este mic 
then insert(T7|i .. j]) 
else  pivor(T[i .. j], D 
(după pivotare, avem: 
i<k<l > T[k]< TI] 
I<k<j > T[k]> TU) 
quicksort(Tli .. l-1]) 
quicksort(T|l+1 .. j]) 


Mai rămâne să concepem un algoritm de pivotare cu timp liniar, care să parcurgă 
tabloul T o singură dată. Putem folosi următoarea tehnică de pivotare: parcurgem 
tabloul T o singură dată, pornind însă din ambele capete. Încercaţi să înţelegeţi 
cum funcţionează acest algoritm de pivotare, în care p = T[i] este elementul pivot: 


procedure pivot(T[i .. j], D 
{permută elementele din T[i .. j] astfel încât, în final, 
elementele lui T[i .. l-1] sunt < p, 
TU] = p, 
iar elementele lui 7[/+1 .. j] sunt > p} 
p © Tli] 
k e i; l «e j+1 
repeat k< k+1 until T[k] >pork=j 
repeat {< l-1 until T[]] <p 
while k < / do 
interschimbă T[k] şi T[H] 
repeat k< k+1 until T[k] > p 
repeat {< l-1 until T[]] <p 
{pivotul este mutat în poziția lui finală} 
interschimbă T[i] şi T[}] 


Intuitiv, ne dăm seama că algoritmul quicksort este ineficient, dacă se întâmplă în 
mod sistematic ca subcazurile T[i .. 1—1] şi T[]+1 .. j] să fie puternic neechilibrate. 
Ne propunem în continuare să analizăm această situație în mod riguros. 
Operația de pivotare necesită un timp în O(n). Fie constanta nọ, astfel încât, în 
cazul cel mai nefavorabil, timpul pentru a sorta n > nọ elemente prin quicksort să 
fie 

t(n) e O(n) + max{t(i)+t(n—i-1) |0 < i< n-1} 
Folosim metoda inducției constructive pentru a demonstra independent că 
te O(n’) gite Qn’). 
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: ORESTA? b _ E ral abat ara 2 
Putem considera că există o constantă reală pozitivă c, astfel încât t(i) < ci +c/2 
pentru 0 <i<nọ Prin ipoteza inducției specificate parțial, presupunem că 


t(i) < ci’+c/2 pentru orice 0 < į < n. Demonstrăm că proprietatea este adevărată şi 
pentru n. Avem 


t(n) < dn + c + c max{i°+(n-i-1)° |0 < i < n-1} 


d fiind o altă constantă. Expresia i+(n-i-1) îşi atinge maximul atunci când i este 
0 sau n-1. Deci, 


t(n) < dn + c + c(n-1) = en?+ cD + n(d—2c) + 3c/2 


Dacă luăm c > 2d, obţinem t(n) < en?+c/2. Am arătat că, dacă c este suficient de 
mare, atunci t(n) < en?+ch pentru orice n > 0, adică, t € O(n). Analog se arată că 
re 0(n2). 


Am arătat, totodată, care este cel mai nefavorabil caz: atunci când, la fiecare nivel 
de recursivitate, procedura pivot este apelată o singură dată. Dacă elementele lui 7 
sunt distincte, cazul cel mai nefavorabil este atunci când iniţial tabloul este 
ordonat crescător sau descrescător, fiecare partiționare fiind total neechilibrată. 
Pentru acest cel mai nefavorabil caz, am arătat că algoritmul guicksort necesită un 


timp în O(n’). 


Ce se întâmplă însă în cazul mediu? Intuim faptul că, în acest caz, subcazurile 
sunt suficient de echilibrate. Pentru a demonstra această proprietate, vom arăta că 
timpul necesar este în ordinul lui n log n, ca şi în cazul cel mai favorabil. 


Presupunem că avem de sortat n elemente distincte şi că iniţial ele pot să apară cu 
probabilitate egală în oricare din cele n! permutări posibile. Operația de pivotare 
necesită un timp liniar. Apelarea procedurii pivot poate poziționa primul element 
cu probabilitatea 1/n în oricare din cele n poziţii. Timpul mediu pentru quicksort 
verifică relația 


t(n) e O(n) + iny Da-i) 
l=1 


Mai precis, fie nọ şi d două constante astfel încât pentru orice n > nọ, avem 


n n-—l 
t(n) < dn + ln l-1)+tn-D) = dn + 2n} (i) 
{=i i=0 


Prin analogie cu mergesort, este rezonabil să presupunem că t e O(n log n) şi să 
aplicăm tehnica inducției constructive, căutând o constantă c, astfel încât 
t(n) < cnlgn. 


Deoarece i lg i este o funcție nedescrescătoare, avem 
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n-l n 2 2 

Š ilgi < Í xlgx dx = E pane < a ine AI pă 
E, 2 4 2 4 
i=mņ+1 x=ng+l Să 


pentru nọ > 1. 


Ţinând cont de această margine superioară pentru 


n-l 


Silgi 


i=ng+l 


puteți demonstra prin inducţie matematică că fn) <cnlgn pentru orice 
n > ng> l, unde 


ad 4 4 


c= + ———— 30 


lge (m+) lge 3 


Rezultă că timpul mediu pentru quicksort este în O(n log n). Pe lângă ordinul 
timpului, un rol foarte important îl are constanta multiplicativă. Practic, constanta 
multiplicativă pentru quicksort este mai mică decât pentru heapsort sau 
mergesort. Dacă pentru cazul cel mai nefavorabil se acceptă o execuție ceva mai 
lentă, atunci, dintre tehnicile de sortare prezentate, quicksort este algoritmul 
preferabil. 


Pentru a minimiza şansa unui timp de execuție în Qn’), putem alege ca pivot 
mediana şirului T[i], T[(i+j) div 2], T[ j]. Preţul plătit pentru această modificare 
este o uşoară creştere a constantei multiplicative. 


7.6 Selecţia unui element dintr-un tablou 


Putem găsi cu uşurinţă elementul maxim sau minim al unui tablou T. Cum putem 
determina însă eficient mediana lui T ? Pentru început, să definim formal mediana 
unui tablou. 


Un element m al tabloului T[1 .. n] este mediana lui T, dacă şi numai dacă sunt 
verificate următoarele două relații: 


ilie (1,...,n) | TU] < m} < [n2] 
iti {1, ..., n} | TU] < m} 2 [n2] 


Această definiţie ține cont de faptul că n poate fi par sau impar şi că elementele 
din T pot să nu fie distincte. Prima relație este mai uşor de înțeles dacă observăm 
că 
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lie (1,...,n) |7Tlil<m)=n-tţie (1,...,n) | TE] > m) 
Condiţia 
ilie (1,...,n) | TU] < m} < [n2] 
este deci echivalentă cu condiția 
#lie {1, ..., n} | TU] 2 m} > n- [n/2]=Ln/2] 


Algoritmul “naiv” pentru determinarea medianei lui T constă în a sorta crescător 
tabloul şi a extrage apoi elementul din poziția [n/2]. Folosind mergesort, de 
exemplu, acest algoritm necesită un timp în O(n log n). Putem găsi o metodă mai 
eficientă? Pentru a răspunde la această întrebare, vom considera o problemă mai 
generală. 


Fie T un tablou de n elemente şi fie k un întreg, 1 <k <n. Problema selecției 
constă în găsirea celui de-al k-lea cel mai mic element al lui T, adică a elementul 
m pentru care avem: 


tie {1, ..., n} | TU] <m} <k 
#{ie {1, ..., n} | TU] <m} 2k 


Cu alte cuvinte, este al k-lea element în T, dacă tabloul este sortat în ordine 
crescătoare. De exemplu, mediana lui T este al [ni2 ]-lea cel mai mic element al 
lui T. Deoarece [n/2]= | (n+1)/2] = (n+1) div 2, mediana lui T este totodată al 
((n+1) div 2)-lea cel mai mic element al lui T. 


Următorul algoritm, încă nu pe deplin specificat, rezolvă problema selecției 
într-un mod similar cu quicksort dar şi cu binsearch. 


function selection(T[1 .. n], k) 
{găseşte al k-lea cel mai mic element al lui T; 
se presupune că 1 <<k<n} 
if n este mic then sortează T 
return T[k] 
p < un element pivot din T[1 .. n] 
u 4 #{ie {1,..., n} | TE] < p} 
ve #{ie {1,..., n} | TE] < p} 
if u > k then 
array U[1 .. u] 
U « elementele din T mai mici decât p 
{cel de-al k-lea cel mai mic element al lui T este 
şi cel de-al k-lea cel mai mic element al lui U} 
return selection (U, k) 
if v > k then {am găsit!) return p 
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(situația când u < k şi v < k} 
array V[1 .. n—v] 
V & elementele din T mai mari decât p 
{cel de-al k-lea cel mai mic element al lui T este 
şi cel de-al (k—v)-lea cel mai mic element al lui V} 
return selection(V, k—v) 


Care element din T să fie ales ca pivot? O alegere naturală este mediana lui T, 
astfel încât U şi V să fie de mărimi cât mai apropiate (chiar dacă cel mult unul din 
aceste subtablouri va fi folosit într-un apel recursiv). Dacă în algoritmul selection 
alegerea pivotului se face prin atribuirea 


p <— selection(T, (n+1) div 2) 
ajungem însă la un cerc vicios. 


Să analizăm algoritmul de mai sus, presupunând, pentru început, că găsirea 
medianei este o operație elementară. Din definiția medianei, rezultă că u < [n2] 
şiv > [n2]. Obţinem atunci relația n—v <|n/2]. Dacă există un apel recursiv, 
atunci tablourile U şi V conţin fiecare cel mult Ln/2] elemente. Restul operaţiilor 
necesită un timp în ordinul lui n. Fie t„(n) timpul necesar acestei metode, în cazul 
cel mai nefavorabil, pentru a găsi al k-lea cel mai mic element al unui tablou de n 
elemente. Avem 


t(n) e O(n) + max{t (Ò | i < La/2]} 
De aici se deduce (Exercițiul 7.17) că t„ e O(n). 


Ce facem însă dacă trebuie să ținem cont şi de timpul pentru găsirea pivotului? 
Putem proceda ca în cazul quicksort-ului şi să renunțăm la mediană, alegând ca 
pivot primul element al tabloului. Algoritmul selection astfel precizat are timpul 
pentru cazul mediu în ordinul exact al lui n. Pentru cazul cel mai nefavorabil, se 


Fi A = . A . . 2 
obţine însă un timp în ordinul lui n^. 


Putem evita acest caz cel mai nefavorabil cu timp pătratic, fără să sacrificăm 
comportarea liniară pentru cazul mediu. Ideea este să găsim rapid o aproximare 
bună pentru mediană. Presupunând n > 5, vom determina pivotul prin atribuirea 


p e pseudomed(T) 
unde algoritmul pseudomed este: 


function pseudomed(T[| .. n]) 
| găseşte o aproximare a medianei lui T} 
sendiv5 
array S[1 .. s] 
for i — 1 to s do S[i] — adhocmed5(T[5i-4 .. 5i]) 
return selection(S, (s+1) div 2) 
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Algoritmul adhocmed$ este elaborat special pentru a găsi mediana a exact cinci 
elemente. Să notăm că adhocmed5 necesită un timp în O(1). 


Fie m aproximarea medianei tabloului 7, găsită prin algoritmul pseudomed. 
Deoarece m este mediana tabloului S, avem 


iti e (1,...,5) | Stil < m} >[s72] 
Fiecare element din S este mediana a cinci elemente din T. În consecință, pentru 
fiecare i, astfel încât S[i] < m, există i,, i», i} între 5i—4 şi Si, astfel ca 
T[i] < TE] < Tii] = Sl] <m 
Deci, 
#{ie {1, ..., n} | TE < m} 2 3f s/2] = 3fLna/5 1/21 
= 3] (n-4)/5 1/2] = 3f (n-4)/10] > (3n-12)/10 
Similar, din relația 
#{ie (1,..., s} | SI] < m} <[s/2] 
care este echivalentă cu 
#{ie {1, ..., s} | Stil 2 m} >Ls/2] 
deducem 
#lie {1, ..., n} | TU] > m} > 3Lla/5L/2] 
= 3Ln/10] = 3f (n-9)/10 | > (3n-27)/10 
Deci, 


#lie (1,....n) | TU] < m) < (Tn+27)/10 


În concluzie, m aproximează mediana lui T, fiind al k-lea cel mai mic element al 
lui T, unde k este aproximativ între 3n/10 şi 7n/10. O interpretare grafică ne va 
ajuta să înțelegem mai bine aceste relații. Să ne imaginăm elementele lui T 
dispuse pe cinci linii, cu posibila excepție a cel mult patru elemente (Figura 7.1). 
Presupunem că fiecare din cele Ln/5] coloane este ordonată nedescrescător, de sus 
în jos. De asemenea, presupunem că linia din mijloc (corespunzătoare tabloului S$ 
din algoritm) este ordonată nedescrescător, de la stânga la dreapta. Elementul 
subliniat corespunde atunci medianei lui S, deci lui m. Elementele din interiorul 
dreptunghiului sunt mai mici sau egale cu m. Dreptunghiul conține aproximativ 
3/5 din jumătatea elementelor lui T, deci în jur de 3n/10 elemente. 
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Presupunând că folosim “p e pseudomed(T)”, adică pivotul este pseudomediana, 
fie t(n) timpul necesar algoritmului selection, în cazul cel mai nefavorabil, pentru 
a găsi al k-lea cel mai mic element al unui tablou de n elemente. Din inegalităţile 


#{ie (1,...,n) | TU] < m} > (3n-12)/10 
4(ie (1,....n) | TU] < m) < (Tn+27)/10 


rezultă că, pentru n suficient de mare, tablourile U şi V au cel mult 3n/4 elemente 
fiecare. Deducem relația 


t(n) e O(n) + t(Ln/5]) + maxtr() | i < 3n/4) (*) 
Vom arăta că re 0(n). Să considerăm funcţia f : N — R”, definită prin recurența 


fm) = flnis) + fl3nr4 + n 
pentru n e N. Prin inducţie constructivă, putem demonstra că există constanta 
reală pozitivă a astfel încât f(n) < an pentru orice n e N. Deci, fe O(n). Pe de 
altă parte, există constanta reală pozitivă c, astfel încât t(n) < cf(n) pentru orice 


n e N”. Este adevărată atunci și relaţia re O(n). Deoarece orice algoritm care 
rezolvă problema selecţiei are timpul de execuţie în O(n), rezultă re O(n), deci, 
te O(n). 

Generalizând, vom încerca să aproximăm mediana nu numai prin împărțire la 
cinci, ci prin împărțire la un întreg q oarecare, 1 <q <n. Din nou, pentru n 
suficient de mare, tablourile U şi V au cel mult 3n/4 elemente fiecare. Relația (*) 
devine 


t(n) € O(n) + t(Ln/q]) + max{t(i) | i < 31/4} (**) 


Dacă 1/q + 3/4 < 1, adică dacă numărul de elemente asupra cărora operează cele 
două apeluri recursive din (**) este în scădere, deducem, într-un mod similar cu 
situația când q=5, că timpul este tot liniar. Deoarece pentru orice gq>5 
inegalitatea precedentă este verificată, rămâne deschisă problema alegerii unui q 
pentru care să obţinem o constantă multiplicativă cât mai mică. 


Figura 7.1 Vizualizarea pseudomedianei. 
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În particular, putem determina mediana unui tablou în timp liniar, atât pentru 
cazul mediu cât și pentru cazul cel mai nefavorabil. Faţă de algoritmul “naiv”, al 
cărui timp este în ordinul lui n log n, îmbunătăţirea este substanţială. 


7.7 O problemă de criptologie 


Alice şi Bob doresc să comunice anumite secrete prin telefon. Convorbirea 
telefonică poate fi însă ascultată și de Eva. În prealabil, Alice şi Bob nu au stabilit 
nici un protocol de codificare şi pot face acum acest lucru doar prin telefon. Eva 
va asculta însă și ea modul de codificare. Problema este cum să comunice Alice și 
Bob, astfel încât Eva să nu poată descifra codul, cu toate că va cunoaşte şi ea 
protocolul de codificare”. 


Pentru început, Alice şi Bob convin în mod deschis asupra unui întreg p cu câteva 
sute de cifre şi asupra unui alt întreg g între 2 şi p—1. Securitatea secretului nu 
este compromisă prin faptul că Eva află aceste numere. 


La pasul doi, Alice şi Bob aleg la întîmplare câte un întreg A, respectiv B, mai 
mici decât p, fără să-şi comunice aceste numere. Apoi, Alice calculează 
a = g^ mod p şi transmite rezultatul lui Bob; similar, Bob transmite lui Alice 
valoarea b = g” mod p. În final, Alice calculează x = b mod p, iar Bob calculează 
y= a? mod p. Vor ajunge la acelaşi rezultat, deoarece x = y = g mod p. Această 
valoare este deci cunoscută de Alice şi Bob, dar rămâne necunoscută lui Eva. 
Evident, nici Alice şi nici Bob nu pot controla direct care va fi această valoare. 
Deci ei nu pot folosi acest protocol pentru a schimba în mod direct un anumit 
mesaj. Valoarea rezultată poate fi însă cheia unui sistem criptografic 
convențional. 


Interceptând convorbirea telefonică, Eva va putea cunoaşte în final următoarele 
numere: p, q, a şi b. Pentru a-l deduce pe x, ea trebuie să găsească un întreg A', 
astfel încât a = g^ mod p şi să procedeze apoi ca Alice pentru a-l calcula pe 
x' = b^ mod p. Se poate arăta (Exercițiul 7.21) că x' = x, deci că Eva poate calcula 
astfel corect secretul lui Alice şi Bob. 


Calcularea lui A' din p, g şi a este cunoscută ca problema logaritmului discret şi 
poate fi realizată de următorul algoritm. 


"O primă soluție a acestei probleme a fost dată în 1976 de W. Diffie şi M. E. Hellman. Între timp s- 
au mai propus şi alte protocoale. 
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function dlog(g, a, p) 
ACO;kel 
repeat 
ACA+I 
k & kg 
until (a = k mod p) or (A = p) 
return A 


Dacă logaritmul nu există, funcția dlog va returna valoarea p. De exemplu, nu 


există un întreg A, astfel încât 3 = 2^ mod 7. Algoritmul de mai sus este însă 
extrem de ineficient. Dacă p este un număr prim impar, atunci este nevoie în 
medie de p/2 repetări ale buclei repeat pentru a ajunge la soluție (presupunând că 
aceasta există). Dacă pentru efecuarea unei bucle este necesară o microsecundă, 
atunci timpul de execuție al algoritmului poate fi mai mare decât vârsta 
Pământului! Iar aceasta se întâmplă chiar şi pentru un număr zecimal p cu doar 24 
de cifre. 


Cu toate că există şi algoritmi mai rapizi pentru calcularea logaritmilor discreți, 
nici unul nu este suficient de eficient dacă p este un număr prim cu câteva sute de 
cifre. Pe de altă parte, nu se cunoaşte până în prezent un alt mod de a-l obține pe x 
din p, g, a şi b, decât prin calcularea logaritmului discret. 


Desigur, Alice şi Bob trebuie să poată calcula rapid exponenţierile de forma 
a= g^ mod p, căci altfel ar fi şi ei puşi în situația Evei. Următorul algoritm pentru 
calcularea exponentțierii nu este cu nimic mai subtil sau eficient decât cel pentru 
logaritmul discret. 


function dexpol(g, A, p) 
a<-l 
for i — 1 to A do a & ag 
return a mod p 


Faptul că x y z mod p = ((x y mod p) z) mod p pentru orice x, y, z şi p, ne permite 
să evităm memorarea unor numere extrem de mari. Obținem astfel o primă 
îmbunătățire: 


function dexpo?2(g, A, p) 
a-l 
for i — 1 to A do a + ag mod p 
return a 


Din fericire pentru Alice şi Bob, există un algoritm eficient pentru calcularea 
exponențierii şi care foloseşte reprezentarea binară a lui A. Să considerăm pentru 
început următorul exemplu 


25 = (a? ii x 
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. . 25 á A E fe sga st d x = 
L-am obţinut deci pe x” prin doar două înmulţiri şi patru ridicări la pătrat. Dacă 
în expresia 
25 ORG) 
x = (x) 1) 1) x 
înlocuim fiecare x cu un 1 şi fiecare 1 cu un 0, obținem secvența 11001, adică 
ANS : s 25 z x 
reprezentarea binară a lui 25. Formula precedentă pentru x” are această formă, 
25 _ 24 24 12 32 z A nfa A x 
deoarece x^ =x x,x =(x °)“ etc. Rezultă un algoritm divide et impera în care 
se testează în mod recursiv dacă exponentul curent este par sau impar. 


function dexpo(g, A, p) 
if A = O then return | 
if A este impar then a — dexpo(g, A-1, p) 
return (ag mod p) 
else a < dexpo(g, A/2,p) 
return (aa mod p) 


Fie h(A) numărul de înmulţiri modulo p efectuate atunci când se calculează 
dexpo(g, A, p), inclusiv ridicarea la pătrat. Atunci, 


0 pentru A = 0 
h(A)=41+h(A-1) pentru A impar 
1+ h(A/2) altfel 


Dacă M(p) este limita superioară a timpului necesar înmulţirii modulo p a două 
numere naturale mai mici decât p, atunci calcularea lui dexpo(g, A, p) necesită un 
timp în O(M(p)h(4)). Mai mult, se poate demonstra că timpul este în 
O(M(p) log A), ceea ce este rezonabil. Ca şi în cazul căutării binare, algoritmul 
dexpo este mai curând un exemplu de simplificare decât de tehnică divide et 
impera. 
Vom înţelege mai bine acest algoritm, dacă considerăm și o versiune iterativă a 
lui. 
function dexpoiterl(g, A, p) 

ce 0;ae l1 

{fie A, A,_... Ap reprezentarea binară a lui A) 

for i — k downto 0 do 

ce 2c 


a — aa mod p 
if A,= 1 then c-ce+l 


a — ag mod p 
return a 


Fiecare iterație foloseşte una din identitățile 
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g™ mod p = (2) mod p 


g mod p S ele y mod p 


în funcție de valoarea lui A, (dacă este 0, respectiv 1). La sfârşitul pasului i, 


valoarea lui c, în reprezentare binară, este A,A- A; . Reprezentrea binară a lui 


A este parcursă de la stânga spre dreapta, invers ca la algoritmul dexpo. Variabila 
c a fost introdusă doar pentru a înțelege mai bine cum funcționează algoritmul și 
putem, desigur, să o eliminăm. 


Dacă parcurgem reprezentarea binară a lui A de la dreapta spre stânga, obținem un 
alt algoritm iterativ la fel de interesant. 


function dexpoiter2(g, A, p) 
ne A;yeg;ae l 
while n > O do 
if n este impar then a — ay mod p 
y — yy mod p 
n & n div 2 
return a 


Pentru a compara aceşti trei algoritmi, vom considera următorul exemplu. 
Algoritmul dexpo îl calculează pe x" sub forma (d x) x) x) x, cu șapte înmulţiri; 
algoritmul dexpoiterl sub forma (°x) x) x) x, cu opt înmulţiri; iar dexpoiter2 
sub forma Lxx xix, tot cu opt înmulţiri (ultima din acestea fiind pentru 
calcularea inutilă a lui x16). 


Se poate observa că nici unul din aceşti algoritmi nu minimizează numărul de 
Pi PE 15 . 4 . A ._. 
înmulţiri efectuate. De exemplu, x ` poate fi obţinut prin şase înmulţiri, sub forma 


xXx 2 2y. Mai mult, x15 oate fi obţinut prin doar cinci înmulţiri (Exercițiul 
P ; P ; ; 


7.8 Înmulțirea matricilor 


Pentru matricile A şi B de nxn elemente, dorim să obţinem matricea produs 
C = AB. Algoritmul clasic provine direct din definiția înmulţirii a două matrici şi 


e) LEN e 2 ORE . 
necesită n` înmulţiri și (n-—l)n” adunări scalare. Timpul necesar pentru calcularea 


R i 3 W Sr ce 
matricii C este deci în O(n'). Problema pe care ne-o punem este să găsim un 
algoritm de înmulţire matricială al cărui timp să fie într-un ordin mai mic decât 


3 £ y 2 si i ohe ES ` 
n`. Pe de altă parte, este clar că O(n) este o limită inferioară pentru orice 
algoritm de înmulțire matricială, deoarece trebuie în mod necesar să parcurgem 


cele n? elemente ale lui C. 
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Strategia divide et impera sugerează un alt mod de calcul a matricii C. Vom 
presupune în continuare că n este o putere a lui doi. Partiţionăm pe A şi B în câte 
patru submatrici de n/2 x n/2 elemente fiecare. Matricea produs C se poate calcula 
conform formulei pentru produsul matricilor de 2 x 2 elemente: 


4 fa) (Bu Ba) (u co) 
Azı A Bai B» Ca Ca 
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unde 


Cii = Au Bu t Ap Bu Ciz = Au Bo + AB» 

Ca = An Bu + AB Ca = An Bo + AB» 
Pentru n = 2, înmulţirile şi adunările din relaţiile de mai sus sunt scalare; pentru 
n > 2, aceste operaţii sunt între matrici de n/2 x n/2 elemente. Operația de adunare 


matricială este cea clasică. In schimb, pentru fiecare înmulţire matricială, aplicăm 
recursiv aceste partiționări, până când ajungem la submatrici de 2 x 2 elemente. 


Pentru a obține matricea C, este nevoie de opt înmulţiri şi patru adunări de matrici 
de n/2 x n/2 elemente. Două matrici de n/2 x n/2 elemente se pot aduna într-un 


timp în O(n’). Timpul total pentru algoritmul divide et impera rezultat este 
(n) € 8t(n/2) + O(n®) 
Definim funcţia 


1 pentru n=1 
8f(n/2)+n? pentru nzl 


ra- 


Din Proprietatea 5.2 rezultă că fe O(n’). Procedând ca în Secțiunea 5.1.2, 
deducem că te O(f)= ©(n°), ceea ce înseamnă că nu am câştigat încă nimic față 
de metoda clasică. 


În timp ce înmulțirea matricilor necesită un timp cubic, adunarea matricilor 
necesită doar un timp pătratic. Este, deci, de dorit ca în formulele pentru 
calcularea submatricilor C să folosim mai puține înmulţiri, chiar dacă prin aceasta 
mărim numărul de adunări. Este însă acest lucru şi posibil? Răspunsul este 
afirmativ. În 1969, Strassen a descoperit o metodă de calculare a submatricilor 
Ci care utilizează 7 înmulţiri şi 18 adunări şi scăderi. Pentru început, se 


calculează şapte matrici de n/2 x n/2 elemente: 
P = (A+ An)(ButB») 
= (Ax + A») Bı 
=  Au(Bp—B») 
An (Bo — Bu) 
= (Au t Ap) Bo» 
= (Ai — AD) (But B2) 
= (An — Ax) (But B») 


SS SGRASRI 
I 
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Este uşor de verificat că matricea produs C se obţine astfel: 


Cy=P+S-T+V Ch =R+T 
Ca =Q0+5S Can =P+R-Q0+U 


Timpul total pentru noul algoritm divide et impera este 
(n) € T(n12) + O(n?) 


şi în mod similar deducem că te O(n" D; Deoarece lg 7 < 2,81, rezultă că 


te O(n’). Algoritmul lui Strassen este deci mai eficient decât algoritmul clasic 
de înmulțire matricială. 


Metoda lui Strassen nu este unică: s-a demonstrat că există exact 36 de moduri 
diferite de calcul a submatricilor Ci fiecare din aceste metode utilizând 7 


înmulţiri. 


Limita O(n”) poate fi şi mai mult redusă dacă găsim un algoritm de înmulțire a 


matricilor de 2 x 2 elemente cu mai puțin de şapte înmulţiri. S-a demonstrat însă 
că acest lucru nu este posibil. O altă metodă este de a găsi algoritmi mai eficienţi 
pentru înmulțirea matricilor de dimensiuni mai mari decât 2x2 și de a 
descompune recursiv până la nivelul acestor submatrici. Datorită constantelor 
multiplicative implicate, exceptând algoritmul lui Strassen, nici unul din acești 
algoritmi nu are o valoare practică semnificativă. 


Pe calculator, s-a putut observa că, pentru n > 40, algoritmul lui Strassen este mai 
eficient decât metoda clasică. In schimb, algoritmul lui Strassen foloseşte 
memorie suplimentară. 


Poate că este momentul să ne întrebăm de unde provine acest interes pentru 
înmulţirea matricilor. Importanţa acestor algoritmi derivă din faptul că operaţii 
frecvente cu matrici (cum ar fi inversarea sau calculul determinantului) se bazează 
pe înmulţiri de matrici. Astfel, dacă notăm cu f (n) timpul necesar pentru a înmulți 
două matrici de nxn elemente şi cu g(n) timpul necesar pentru a inversa o 
matrice nesingulară de n x n elemente, se poate arăta că fe 0(g). 


7.9 Înmulțirea numerelor întregi mari 


Pentru anumite aplicaţii, trebuie să considerăm numere întregi foarte mari. Dacă 
ați implementat algoritmii pentru generarea numerelor lui Fibonacci, probabil că 


S-au propus şi metode ici diferite. Astfel, D. Coppersmith şi S. Winograd au găsit în 1987 un 
algoritm cu timpul în O(n” 
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v-aţi confruntat deja cu această problemă. Acelaşi lucru s-a întâmplat în 1987, 
atunci când s-au calculat primele 134 de milioane de cifre ale lui 7. În criptologie, 
numerele întregi mari sunt de asemenea extrem de importante (am văzut acest 
lucru în Secţiunea 7.7). Operaţiile aritmetice cu operanzi întregi foarte mari nu 
mai pot fi efectuate direct prin hardware, deci nu mai putem presupune, ca până 
acum, că operaţiile necesită un timp constant. Reprezentarea operanzilor în 
virgulă flotantă ar duce la aproximări nedorite. Suntem nevoiţi deci să 
implementăm prin software operaţiile aritmetice respective. 


In cele ce urmează, vom da un algoritm divide et impera pentru înmulțirea 
întregilor foarte mari. Fie u şi v doi întregi foarte mari, fiecare de n cifre zecimale 


(convenim să spunem că un întreg k are j cifre dacă k < 10/, chiar dacă k < 10%, 
Dacă s = În], reprezentăm pe u şi v astfel: 


u=10w+x, v=10%y+z, unde 0sx<10',0sz< 10 


<P— În 12) —> 4— la/2] —> 


Întregii w şi y au câte [n12] cifre, iar întregii x şi z au câte Ln/2] cifre. Din relația 
uv = 10%wy + 10°(wz+xy) + xz 


obținem următorul algoritm divide et impera pentru înmulțirea a două numere 
întregi mari. 
function înmulțire(u, v) 
n & cel mai mic întreg astfel încât u şi v să aibă fiecare n cifre 
if n este mic then calculează în mod clasic produsul uv 
return produsul uv astfel calculat 
s n diy 2 
w + u div 10°; x< u mod 10° 
y ev div 10"; z & v mod 10° 
return  înmulțire(w, y) X 10% 
+ (înmulțire(w, 2)+înmulţire(x, y)) x 10° 
+ înmulțire(x, z) 
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Presupunând că folosim reprezentarea din Exerciţiul 7.28, înmulțirile sau 


A EIE PX : S e aoa A : ._. 
împărțirile cu 10” şi 10%, ca și adunările, sunt executate într-un timp liniar. 
Același lucru este atunci adevărat şi pentru restul împărţirii întregi, deoarece 


u mod 10' = u — 10°w, v mod 10°=v-— 10° y 


Notăm cu î,„(n) timpul necesar acestui algoritm, în cazul cel mai nefavorabil, 
pentru a înmultți doi întregi de n cifre. Avem 


ta(n) € 3ta (|n 2 + ty (|n) + ©) 
Dacă n este o putere a lui 2, această relație devine 
ta(n) e 4t; (n12) + O(n) 


Folosind Proprietatea 5.2, obținem relația t} € O(n’). (Se observă că am reîntâlnit 


un exemplu din Secțiunea 5.3.5). Înmulțirea clasică necesită însă tot un timp 
pătratic (Exercițiul 5.29). Nu am câştigat astfel nimic; dimpotrivă, am reuşit să 
mărim constanta multiplicativă! 


Ideea care ne va ajuta am mai folosit-o la metoda lui Strassen (Secţiunea 7.8). 
Deoarece înmulţirea întregilor mari este mult mai lentă decât adunarea, încercăm 
să reducem numărul înmulţirilor, chiar dacă prin aceasta mărim numărul 
adunărilor. Adică, încercăm să calculăm wy, wz+xy şi xz prin mai puţin de patru 
înmulţiri. Considerând produsul 


r = (w+x)(y+z) = wy + (wz+xy) + xz 
observăm că putem înlocui ultima linie din algoritm cu 


r — înmult(w+x, y+z) 
p — înmult(w, y), q — înmult(x, z) 
return 10%p + 10“%(r-p-q) +q 


Fie t(n) timpul necesar algoritmului modificat pentru a înmulți doi întregi, fiecare 
cu cel mult n cifre. Ținând cont că w+x şi y+z pot avea cel mult 1+| n/2] cifre, 
obținem 


t(n) € tn + tin) + tn 2) + O(n) 
Prin definiţie, funcţia t este nedescrescătoare. Deci, 
t(n) € 31+ n/2 l) + O(n) 
Notând T(n) = t(n+2) şi presupunând că n este o putere a lui 2, obținem 
T(n) e 3T(n/2) + O(n) 
Prin metoda iterației (ca în Exerciţiul 7.24), puteţi arăta că 


Te O(n? | n este o putere a lui 2) 
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Sau, mai elegant, puteți ajunge la acelaşi rezultat aplicând o schimbare de 
variabilă (o recurenţă asemănătoare a fost discutată în Secţiunea 5.3.5). Deci, 


re O(n? | n este o putere a lui 2) 


Ținând din nou cont că 1 este nedescrescătoare, aplicăm Proprietatea 5.1 şi 


obţinem re O(n °). 


In concluzie, este posibil să înmulţim doi întregi de n cifre într-un timp în 


O(n" 3, deci şi în O(n!:5%). Ca şi la metoda lui Strassen, datorită constantelor 
multiplicative implicate, acest algoritm este interesant în practică doar pentru 
valori mari ale lui n. O implementare bună nu va folosi probabil baza 10, ci baza 
cea mai mare pentru care hardware-ul permite ca două “cifre” să fie înmulţite 
direct. 


7.10 Exerciţii 


7.1 Demonstraţi că procedura binsearch se termină într-un număr finit de paşi 
(nu ciclează). 


Indicaţie: Arătaţi că binrec(T7[i .. j], x) este apelată întotdeauna cu i<j şi că 
binrec(T|i .. j], x) apelează binrec(Tlu .. v], x) întotdeauna astfel încât 


v-u < j-i 


7.2 Se poate înlocui în algoritmul iterbin1: 
i) “k< (i+j+1) div 2” cu “k e (i+j) div 2”? 
ii) “i< k” cu “i e k+1”? 
iii) “j e k-11” cu “j e k”? 


7.3 Observaţi că bucla while din algoritmul insert (Secțiunea 1.3) foloseşte o 
căutare secvențială (de la coadă la cap). Să înlocuim această căutare secvențială 
cu o căutare binară. Pentru cazul cel mai nefavorabil, ajungem oare acum ca 
timpul pentru sortarea prin inserție să fie în ordinul lui n log n? 


7.4 Arătați că timpul pentru iterbin2 este în ©(1), O(log n), O(log n) pentru 
cazurile cel mai favorabil, mediu şi respectiv, cel mai nefavorabil. 


7.5 Fie T[1 .. n] un tablou ordonat crescător de întregi diferiți, unii putând fi 
negativi. Daţi un algoritm cu timpul în O(log n) pentru cazul cel mai nefavorabil, 
care găseşte un index i, 1 < i < n, cu T[i] = i, presupunând că acest index există. 
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7.6 Rădăcina pătrată întreagă a lui ne N este prin definiție acel pe N 
pentru care p < Jn < p+1. Presupunând că nu avem o funcție radical, elaborați un 
algoritm care îl găseşte pe p într-un timp în O(log n). 


Soluție: Se apelează pătrat(0, n+1, n), pătrat fiind funcția 


function pătrat(a, b, n) 
if a = b—1 then return a 
m < (a+b) div 2 
ifm’ <n then pătrat(m, b, n) 
else  părrat(a, m, n) 


7.7 Fie tablourile U[1 .. N] şi V[1 .. M], ordonate crescător. Elaborați un 
algoritm cu timpul de execuție în O(N+M), care să interclaseze cele două tablouri. 
Rezultatul va fi trecut în tabloul T[1 .. N+M]. 


Soluţie: Iată o primă variantă a acestui algoritm: 


i,j,k 1 
while i < N and j < M do 
if Uli] < V[j] then T[k] Uli] 
i i+l 
else T[k] < VIJ] 
je j+1 
k & k+l 
ifi > N then for h & j to M do 
T[k] — VIN] 
k e k+l 
else for h — i to N do 
T[k] — U[h] 
k & k+l 


Se poate obține un algoritm şi mai simplu, dacă se presupune că avem acces la 
locațiile U[N+1] şi V[M+1], pe care le vom inițializa cu o valoare maximală şi le 
vom folosi ca “santinele”: 
ije 1 
U[N+1], VIM+1] e +% 
for k 1 to N+M do 
if U[i] < V] then 7lk] Uli] 
i < i+l 
else T[k] < VIJ] 
je j+l 
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7.8 Modificaţi algoritmul mergesort astfel încât T să fie separat nu în două, ci 
în trei părți de mărimi cât mai apropiate. Analizaţi algoritmul obținut. 


7.9 Arătaţi că, dacă în algoritmul mergesort separăm pe T în tabloul U, având 
n-—l elemente, şi tabloul V, având un singur element, obținem un algoritm de 


. era a 2 . Gee i . 
sortare cu timpul de execuție în O(n“). Acest nou algoritm seamănă cu unul dintre 
algoritmii deja cunoscuți. Cu care anume? 


7.10 Iată şi o altă procedură de pivotare: 


procedure pivoti (T[i .. j], D 
pe T[i] 
lei 
for k — i+1 to j do 
if T[k] <p then l< h1 
interschimbă T[k] şi T[}Z] 
interschimbă T[i] şi T[/] 


Argumentați de ce procedura este corectă şi analizați eficiența ei. Comparați 
numărul maxim de interschimbări din procedurile pivot şi pivotl. Este oare 
rentabil ca în algoritmul quicksort să înlocuim procedura pivot cu procedura 
pivotl? 


7.11 Argumentați de ce un apel funny-sort(T[1 ..n ]) al următorului algoritm 
sortează corect elementele tabloului T[1 .. n]. 


procedure funny-sort(T|i .. j]) 
if T[i] > T[ j] then interschimbă T[i] şi T[ j] 
if i <j-l then ke ( j—i+1) div 3 
funny-sort(Tli .. j-k]) 
funny-sort(TlLi+k .. j]) 
funny-sort(Tli .. j-k]) 


Este oare acest simpatic algoritm şi eficient? 


7.12 Este un lucru elementar să găsim un algoritm care determină minimul 
dintre elementele unui tablou T[1 .. n] şi utilizează pentru aceasta n—l comparații 
între elemente ale tabloului. Mai mult, orice algoritm care determină prin 
comparații minimul elementelor din T efectuează în mod necesar cel puţin n-l 
comparații. În anumite aplicaţii, este nevoie să găsim atât minimul cât şi maximul 
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dintr-o mulţime de n elemente. Iată un algoritm care determină minimul și 
maximul dintre elementele tabloului T[1 .. n]: 


procedure fmaxmin1(T[1 .. n], max, min) 
max, min 4+ T[1] 
for i — 2 to n do 
if max < T[i] then max — T[i] 
if min > T[i] then min — T[i] 


Acest algoritm efectuează 2(n—-1) comparații între elemente ale lui T. Folosind 
tehnica divide et impera, elaboraţi un algoritm care să determine minimul și 
maximul dintre elementele lui T prin mai puţin de 2(n—-1) comparații. Puteţi 
presupune că n este o putere a lui 2. 


Soluţie: Un apel fmaxmin2(T[1 .. n], max, min) al următorului algoritm găseşte 
minimul și maximul cerute 


procedure fmaxmin2(T[i .. j], max, min) 
case i=j: max, min + T[i] 
i = j-1 : if T[i] < T[ j] then max & TÍ j] 
min <+ T|i] 
else max & T[i] 
min + T[ j] 
otherwise : m <— (i+j) div 2 
fmaxmin2(Tli .. m], smax, smin) 
fmaxmin2(T[m+1 .. j], dmax, dmin) 
max — maxim(smax, dmax) 
min <— minim(smin, dmin) 
Funcțiile maxim şi minim determină, prin câte o singură comparație, maximul, 


respectiv minimul, a două elemente. 


Putem deduce că atât fmaxmin1, cât şi fmaxmin2 necesită un timp în O(n) pentru a 
găsi minimul şi maximul într-un tablou de n elemente. Constanta multiplicativă 
asociată timpului în cele două cazuri diferă însă. Notând cu C(n) numărul de 
comparații între elemente ale tabloului T efectuate de procedura fmaxmin2, 
obținem recurența 


0 pentru n=1 
C(n)=;1 pentru n=2 
C(ln/2l)+ C(nr2h+2 pentru n>2 


e 4 k . n P 
Considerăm n = 2 şi folosim metoda iterației: 


k-1 
Cn) =2C(n12)+2=...=2 CO) $ 2 =2 +24 -2=3n/2-2 


i=1 


Secțiunea 7.10 Exerciţii 183 


Algoritmul fmaxmin2 necesită cu 25% mai puţine comparații decât fmaxminl. Se 
poate arăta că nici un algoritm bazat pe comparații nu poate folosi mai puţin de 
3n/2—2 comparații. In acest sens, fmaxmin?2 este, deci, optim. 


Este procedura fmaxmin2 mai eficientă şi în practică? Nu în mod necesar. Analiza 
ar trebui să considere și numărul de comparații asupra indicilor de tablou, precum 
şi timpul necesar pentru rezolvarea apelurilor recursive în fmaxmin?2. De 
asemenea, ar trebui să cunoaștem și cu cât este mai costisitoare o comparaţie de 
elemente ale lui 7, decât o comparaţie de indici (adică, de întregi). 


7.13 În ce constă similaritatea algoritmului selection cu algoritmul i) quicksort 
ŞI ii) binsearch? 


7.14  Generalizaţi procedura pivot, partiţionând tabloul T în trei secţiuni 
T[1 .. i—1], 7T[i..j], 7[j+1..n], conţinând elementele lui T mai mici decât p, 
egale cu p şi respectiv, mai mari decât p. Valorile i şi j vor fi calculate în 
procedura de pivotare şi vor fi returnate prin această procedură. 


7.15 Folosind ca model versiunea iterativă a căutării binare şi rezultatul 
Exerciţiului 7.14, elaboraţi un algoritm nerecursiv pentru problema selecției. 


7.16  Analizaţi următoarea variantă a algoritmului quicksort. 


procedure quicksort-modificat(T[1 .. n]) 
if n = 2 and T[2] < T[1] 
then interschimbă T[1] și 7[2] 
else if n > 2 then 
p + selection(T, (n+1) div 2) 
arrays U[1 .. (n+1) div 2 ], VII .. n div 2] 
U « elementele din T mai mici decât p 
Şi, în completare, elemente egale cu p 
V< elementele din T mai mari decât p 
şi, în completare, elemente egale cu p 
quicksort-modificat(U) 
quicksort-modificat(V) 


7.17 Dacă presupunem că găsirea medianei este o operaţie elementară, am 
văzut că timpul pentru selection, în cazul cel mai nefavorabil, este 


Gi) | i < Ln/2]} 


t(n) e O(n) + max{t 


m 


Demonstraţi că t, e O(n). 
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Soluţie: Fie n, şi d două constante astfel încât pentru n > ng avem 


(n) < dn + max{t, (Ð | i <n/2]) 


tm 


Putem considera că există constanta reală pozitivă c astfel încât t„(i) < ci+c, 
pentru 0<;¿i<n Prin ipoteza inducției specificate parțial presupunem că 


t(i) < ci+c, pentru orice 0 < i < n. Atunci 


ta(n) S dn+c+cln/2] = cn+c+dn-cln/2 | < cn+e 


deoarece putem să alegem constanta c suficient de mare, astfel încât d ni2] > dn. 
Am arătat deci prin inducție că, dacă c este suficient de mare, atunci t„(n) < cn+c, 


pentru orice n > 0. Adică, t„ e O(n). 


7.18 Arătaţi că luând “p + T[1]” în algoritmul selection şi considerând cazul 
cel mai nefavorabil, determinarea celui de-al k-lea cel mai mic element al lui 


T[1 .. n] necesită un timp de execuţie în Oln’). 


7.19 Fie U[l..n] şi V[l..n] două tablouri de elemente ordonate 
nedescrescător. Elaborați un algoritm care să găsească mediana celor 2n elemente 
într-un timp de execuție în O(log n). 


7.20 Un element x este majoritar în tabloul T[l..n], dacă 
#{i| Tii] =x} > Ln/2]. Elaborați un algoritm liniar care să determine elementul 
majoritar în T (dacă un astfel de element există). 


7.21 Să presupunem că Eva a găsit un A' pentru care 
a = g^ mod p = g“ mod p 
şi că există un B, astfel încât b = g” mod p. Arătați că 
x' = bi mod p = b^ mod p = x 


chiar dacă A'z A. 


7.22 Arătați cum poate fi calculat x” prin doar cinci înmulţiri (inclusiv ridicări 
la pătrat). 


Soluție: x! = (32 > x! 
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7.23 Găsiți un algoritm divide et impera pentru a calcula un termen oarecare 
din şirul lui Fibonacci. Folosiţi proprietatea din Exerciţiul 1.7. Vă ajută aceasta la 
înțelegerea algoritmului fib3 din Secţiunea 1.6.4? 


Indicaţie: Din Exerciţiul 1.7, deducem că f, = m”, unde m” este elementul 


n-i 


de pe ultima linie şi ultima coloană ale matricii M  . Rămâne să elaborați un 


algoritm similar cu dexpo pentru a afla matricea putere M". Dacă, în loc de 
dexpo, folosiți ca model algoritmul dexpoiter2, obţineţi algoritmul fib3. 


7.24  Demonstraţi că algoritmul lui Strassen necesită un timp în O(n! D, 
folosind de această dată metoda iterației. 


Soluţie: Fie două constante pozitive a şi c, astfel încât timpul pentru algoritmul 
lui Strassen este 


(n) < TNI) + cn? 
pentru n > 2, iar t(n) < a pentru n < 2. Obţinem 
t(n) < cn%(1+7/4+(7149+...+1/495 5 + a7! 


cn’(1/14)8" + a7” 


IA 


lg 4+lg 7-lg 4 lg 7 lg 7 
= cn 5 S“+ant'e Oln?’) 


7.25 Cum aţi modifica algoritmul lui Strassen pentru a înmulţi matrici den xn 
elemente, unde n nu este o putere a lui doi? Arătaţi că timpul algoritmului rezultat 


este tot în O(n”). 


Indicaţie: Îl majorăm pe n până la cea mai mică putere a lui 2, completând 
corespunzător matricile A şi B cu elemente nule. 


7.26 Să presupunem că avem o primitivă grafică box(x, y, r), care desenează un 
pătrat 2rX 2r centrat în (x, y), ştergând zona din interior. Care este desenul 
realizat prin apelul star(a, b, c), unde star este algoritmul 


procedure star(x, y, r) 
if r > 0 then star(x-r, y+r, r div 2) 
star(x+r, y+r, r div 2) 
star(x—-r, y—r, r div 2) 
star(x+r, y—r, r div 2) 
box(x, y, r) 


Care este rezultatul, dacă box(x, y, r) apare înaintea celor patru apeluri recursive? 
Arătați că timpul de execuție pentru un apel star(a, b, c) este în @(c°). 
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7.27  Demonstraţi că pentru orice întregi m şi n sunt adevărate următoarele 
proprietăţi: 

i) dacă m şi n sunt pare, atunci cmmdc(m, n) = 2cmmdc(m/2, n/2) 

ii) dacă m este impar și n este par, atunci cmmdc(m, n) = emmdc(m, n/2) 

iii) dacă m şi n sunt impare, atunci cmmdc(m, n) = emmdce((m-—n)/2, n) 


Pe majoritatea calculatoarelor, operaţiile de scădere, testare a parităţii unui întreg 
şi împărțire la doi sunt mai rapide decât calcularea restului împărțirii întregi. 
Elaboraţi un algoritm divide et impera pentru a calcula cel mai mare divizor 
comun a doi întregi, evitând calcularea restului împărţirii întregi. Folosiţi 
proprietățile de mai sus. 


7.28 Găsiți o structură de date adecvată, pentru a reprezenta numere întregi 
mari pe calculator. Pentru un întreg cu n cifre zecimale, numărul de biţi folosiți 
trebuie să fie în ordinul lui n. Înmulțirea şi împărţirea cu o putere pozitivă a lui 10 
(sau altă bază, dacă preferaţi) trebuie să poată fi efectuate într-un timp liniar. 
Adunarea şi scăderea a două numere de n, respectiv m cifre trebuie să poată fi 
efectuate într-un timp în O(n+m). Permiteţi numerelor să fie şi negative. 


7.29 Fie u şi v doi întregi mari cu n, respectiv m cifre. Presupunând că folosiţi 
structura de date din Exerciţiul 7.28, arătaţi că algoritmul de înmulțire clasică (şi 
cel “a la russe”) a lui u cu v necesită un timp în O(nm). 


8. Algoritmi de 
programare dinamică 


8.1 Trei principii fundamentale ale programării 
dinamice 


Programarea dinamică, ca şi metoda divide et impera, rezolvă problemele 
combinând soluţiile subproblemelor. După cum am văzut, algoritmii divide et 
impera  partiționează problemele în  subprobleme independente, rezolvă 
subproblemele în mod recursiv, iar apoi combină soluțiile lor pentru a rezolva 
problema inițială. Dacă subproblemele conțin subsubprobleme comune, în locul 
metodei divide et impera este mai avantajos de aplicat tehnica programării 
dinamice. 


Să analizăm însă pentru început ce se întâmplă cu un algoritm divide et impera în 
această din urmă situație. Descompunerea recursivă a cazurilor în subcazuri ale 
aceleiaşi probleme, care sunt apoi rezolvate în mod independent, poate duce 
uneori la calcularea de mai multe ori a aceluiaşi subcaz, şi deci, la o eficiență 
scăzută a algoritmului. Să ne amintim, de exemplu, de algoritmul fibl din 
Capitolul 1. Sau, să calculăm coeficientul binomial 


n-1 n-1 

| ):[ pentru 0< k < n 
*)- k-1 k 
k 


1 altfel 


în mod direct: 


function C(n, k) 
ifk=0ork=n then return 1 
else return C(n-—1, k-1) + C(n-1, k) 


Multe din valorile C(i,j)ů i<n, j< k, sunt calculate în mod repetat (vezi 


n 
Exercițiul 2.5). Deoarece rezultatul final este obținut prin adunarea a a de 1, 


n 
rezultă că timpul de execuție pentru un apel C(n, k) este în Q( *) ). 


185 
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Dacă memorăm rezultatele intermediare într-un tablou de forma 


Ol 
II 1 
2|1 2 1 


(acesta este desigur triunghiul lui Pascal), obţinem un algoritm mai eficient. De 
fapt, este suficient să memorăm un vector de lungime k, reprezentând linia curentă 
din triunghiul lui Pascal, pe care să-l reactualizăm de la dreapta la stânga. Noul 
algoritm necesită un timp în O(nk). Pe această idee se bazează şi algoritmul fib2 
(Capitolul 1). Am ajuns astfel la primul principiu de bază al programării 
dinamice: evitarea calculării de mai multe ori a aceluiaşi subcaz, prin memorarea 
rezultatelor intermediare. 


Putem spune că metoda divide et impera operează de sus în jos (top-down), 
descompunând un caz în subcazuri din ce în ce mai mici, pe care le rezolvă apoi 
separat. Al doilea principiu fundamental al programării dinamice este faptul că ea 
operează de jos în sus (bottom-up). Se porneşte de obicei de la cele mai mici 
subcazuri. Combinând soluţiile lor, se obţin soluții pentru subcazuri din ce în ce 
mai mari, pînă se ajunge, în final, la soluţia cazului iniţial. 


Programarea dinamică este folosită de obicei în probleme de optimizare. În acest 
context, conform celui de-al treilea principiu fundamental, programarea dinamică 
este utilizată pentru a optimiza o problemă care satisface principiul optimalității: 
într-o secvenţă optimă de decizii sau alegeri, fiecare subsecvenţă trebuie să fie de 
asemenea optimă. Cu toate că pare evident, acest principiu nu este întotdeauna 
valabil şi aceasta se întâmplă atunci când subsecvenţele nu sunt independente, 
adică atunci când optimizarea unei secvenţe intră în conflict cu optimizarea 
celorlalte subsecvenţe. 


Pe lângă programarea dinamică, o posibilă metodă de rezolvare a unei probleme 
care satisface principiul optimalităţii este şi tehnica greedy. In Secţiunea 8.6 vom 
ilustra comparativ aceste două tehnici. 
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Ca şi în cazul algoritmilor greedy, soluția optimă nu este în mod necesar unică. 
Dezvoltarea unui algoritm de programare dinamică poate fi descrisă de 
următoarea succesiune de paşi: 


e se caracterizează structura unei soluţii optime 
e se defineşte recursiv valoarea unei soluţii optime 
e se calculează de jos în sus valoarea unei soluţii optime 


Dacă pe lângă valoarea unei soluţii optime se doreşte şi soluția propriu-zisă, 
atunci se mai efectuează următorul pas: 


e din informaţiile calculate se construieşte de sus în jos o soluţie optimă 


Acest pas se rezolvă în mod natural printr-un algoritm recursiv, care efectuează o 
parcurgere în sens invers a secvenței optime de decizii calculate anterior prin 
algoritmul de programare dinamică. 


8.2 O competiţie 


În acest prim exemplu de programare dinamică nu ne vom concentra pe principiul 
optimalităţii, ci pe structura de control şi pe ordinea rezolvării subcazurilor. Din 
această cauză, problema considerată în această secțiune nu va fi o problemă de 
optimizare. 


Să ne imaginăm o competiţie în care doi jucători A şi B joacă o serie de cel mult 
2n-—l partide, câştigător fiind jucătorul care acumulează primul n victorii. 
Presupunem că nu există partide egale, că rezultatele partidelor sunt independente 
între ele şi că pentru orice partidă există o probabilitate p constantă ca să câştige 
jucătorul A şi o probabilitate q = l—p ca să câştige jucătorul B. 


Ne propunem să calculăm P(i,j), probabilitatea ca jucătorul A să câştige 
competiţia, dat fiind că mai are nevoie de i victorii şi că jucătorul B mai are 
nevoie de j victorii pentru a câştiga. În particular, la începutul competiţiei această 
probabilitate este P(n, n), deoarece fiecare jucător are nevoie de n victorii. Pentru 
1 Sin, avem P(0,i)= 1 şi P(i, 0) =0. Probabilitatea P(0, 0) este nedefinită. 
Pentru i, j > 1, putem calcula P(i, j) după formula: 


PU, j) = pP(i-1, j) + qP(i, j-1) 
algoritmul corespunzător fiind: 


function P(i, j) 
if i = 0 then return | 
if j = O then return 0 
return pP(i—1, j) + qP(i, j-l) 
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P (i, j) încă k partide de jucat 
P (i-1, j) P (i, j-1) încă k-1 partide de jucat 
P (i-2, j) P (i-l, j-1) P (i-1, j-2) încă k-2 partide de jucat 


Figura 8.1 Apelurile recursive efectuate după un apel al funcției P(i, j). 


Fie (k) timpul necesar, în cazul cel mai nefavorabil, pentru a calcula 
probabilitatea P(i, j), unde k = i+j. 


Avem: 
t(1)<a 
t(k) < 2t(k-1)+c, k>1 


a şi c fiind două constante. Prin metoda iterației, obținem t € o2"), iar dacă 


i=j=n, atunci te 0(4"). Dacă urmărim modul în care sunt generate apelurile 
recursive (Figura 8.1), observăm că este identic cu cel pentru calculul ineficient al 
coeficienţilor binomiali: 


C(i+j, j) = CUI), j) + CUH j=1), j—1) 

Din Exercițiul 8.1 rezultă că numărul total de apeluri recursive este 
i 
2 Í | ay 
J 
: | . 2n ; l 
Timpul de execuție pentru un apel P(n, n) este deci în Q( ). Ținând cont şi de 
n 
Exercițiul 8.3, obținem că timpul pentru calculul lui P(n,n) este în 
0(4') n Q(4"/n). Aceasta înseamnă că, pentru valori mari ale lui n, algoritmul 
este ineficient. 


Pentru a îmbunătăți algoritmul, vom proceda ca în cazul triunghiului lui Pascal. 
Tabloul în care memorăm rezultatele intermediare nu îl vom completa, însă, linie 
cu linie, ci pe diagonală. Probabilitatea P(n, n) poate fi calculată printr-un apel 
serie(n, p) al algoritmului 
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function serie(n, p) 
array P[0..n, 0..n] 
q e l-p 
for s — 1 ton do 
P[0, s] — 1; P[s, 0] 0 
for k 1 to s—1 do 
P[k, s—k] — pP[k-1, s-k] + qPlăk, s=k-—1] 
for s — 1 ton do 
for k + 0 to n-s do 
P[s+k, n-k] — pP[s+k-1, n-k] + qP[s+k, n—k-—1] 
return P[n, n] 


Deoarece în esență se completează un tablou de nxn elemente, timpul de 

: ; A 2 ppn MNAE 
execuție pentru un apel serie(n, p) este în 0(n'). Ca şi în cazul coeficienţilor 
binomiali, nu este nevoie să memorăm întregul tablou P. Este suficient să 
memorăm diagonala curentă din P, într-un vector de n elemente. 


8.3 Înmulțirea înlănțuită a matricilor 


Ne propunem să calculăm produsul matricial 


M=M,M,...M 


n 


Deoarece înmulțirea matricilor este asociativă, putem opera aceste înmulţiri în 
mai multe moduri. Înainte de a considera un exemplu, să observăm că înmulțirea 
clasică a unei matrici de p x q elemente cu o matrice de q x r elemente necesită 
pqr înmulţiri scalare. 


Dacă dorim să obţinem produsul ABCD al matricilor A de 13 x 5, B de 5 x 89, C 
de 89x3 şi D de 3 x 34 elemente, în funcţie de ordinea efectuării înmulţirilor 
matriciale (dată prin paranteze), numărul total de înmulţiri scalare poate să fie 
foarte diferit: 


(((AB)O)D) 10582 înmulţiri 
((AB)(CD)) 54201 înmulţiri 
((A(BO)D) 2856 înmulţiri 
(A((BO)D)) 4055 înmulţiri 
(A(B(CD))) 26418 înmulţiri 


Cea mai eficientă metodă este de aproape 19 ori mai rapidă decât cea mai 
ineficientă. In concluzie, ordinea de efectuare a înmulţirilor matriciale poate avea 
un impact dramatic asupra eficienţei. 
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În general, vom spune că un produs de matrici este complet parantezat, dacă este: 
i) o singură matrice, sau ii) produsul a două produse de matrici complet 
parantezate, înconjurat de paranteze. Pentru a afla în mod direct care este ordinea 
optimă de efectuare a înmulţirilor matriciale, ar trebui să parantezăm expresia lui 
M în toate modurile posibile și să calculăm de fiecare dată care este numărul de 
înmulţiri scalare necesare. 


Să notăm cu T(n) numărul de moduri în care se poate paranteza complet un produs 
A 


de n matrici. Să presupunem că decidem să facem prima “tăietură” între a i-a şi a 
(i+1)-a matrice a produsului 


M = (M, M, ... M)(M,; Misa --- M,) 


Sunt acum T(i) moduri de a paranteza termenul stâng și T(n—i) moduri de a 
paranteza termenul drept. Deoarece i poate lua orice valoare între 1 şi n-l1, 
obținem recurența 


n-l 


T(n) = 5, TO) Tn-i) 


i=l 


cu T(1) = 1. De aici, putem calcula toate valorile lui T(n). De exemplu, T(5) = 14, 
T(10) = 4862, T(15) = 2674440. Valorile lui T(n) sunt cunoscute ca numerele 
catalane. Se poate demonstra că 
1 (2n—2 
T(n) = — 


nin-l 


Din Exerciţiul 8.3 rezultă Te Q(4"/n’). Deoarece, pentru fiecare mod de 
parantezare, operația de numărare a înmulțirilor scalare necesită un timp în O(n), 


determinarea modului optim de a-l calcula pe M este în Q(4"/n). Această metodă 
directă este deci foarte neperformantă și o vom îmbunătăţi în cele ce urmează. 


Din fericire, principiul optimalității se poate aplica la această problemă. De 
exemplu, dacă cel mai bun mod de a înmulți toate matricile presupune prima 
tăietură între a i-a şi a i+l-a matrice a produsului, atunci subprodusele 
M, M, ... M; şi Mı Mio... M, trebuie şi ele calculate într-un mod optim. 


EnF i+1 n 
Aceasta ne sugerează să aplicăm programarea dinamică. 


Vom construi tabloul m[l..n, 1.. n], unde mļ[i,j] este numărul minim de 
înmulţiri scalare necesare pentru a calcula partea M, Mpi ... M, a produsului 
inițial. Soluția problemei inițiale va fi dată de m[1, n]. Presupunem că tabloul 
d[0 .. n] conține dimensiunile matricilor M, astfel încât matricea M, este de 


dimensiune d[i-—1] x d[i], 1 < i < n. Construim tabloul m diagonală cu diagonală: 


diagonala s conține elementele mļ[i, j] pentru care j-i=s. Obținem astfel 
succesiunea 
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s=0 : mli, i] =0, i=1,2,... n 

s=1 : m[i, i+1] = d[i—1] d[i] d[i+1], i=1, 2, ..., n—1 

l<s<n : mļ[i, i+s]= min (mļ[i, k] + m[k+1, i+s] + d[i—1] d[k] d[i+s]), 
i<k<i+s 


i = 1,2, ..., ns 


A treia situaţie reprezintă faptul că, pentru a calcula M,M,,, ... M;, încercăm 


i+s? 


(M; Mii- MO (Mi Mera «e: Miss) 


şi o alegem pe cea optimă, pentru i Sk <i+s. A doua situaţie este de fapt o 
particularizare a celei de-a treia situaţii, cu s = 1. 


Pentru matricile A, B, C, D, din exemplul precedent, avem 
d = (13, 5, 89, 3, 34) 


Pentru s = 1, găsim m[1, 2] = 5785, m[2, 3] = 1335, m[3, 4] = 9078. Pentru s = 2, 
obținem 


m[1, 3] = min(m[1, 1] + m[2, 3] + 13x5x3, m[1, 2] + m[3, 3] + 13x89x3) 
= min(1530, 9256) = 1530 
m[2, 4] = min(m[2, 2] + m[3, 4] + 5x89x34, m[2, 3] + m[4, 4] + 5x3x34) 
= min(24208, 1845) = 1845 
Pentru s = 3, 
m[1, 4] = min( {k=1} m[1, 1] + m[2, 4] + 13x5x34, 
{k=2} m[1, 2] + m[3, 4] + 13x89x34, 
{k=3} m[1, 3] + m[4, 4] + 13x3x34) 
= min(4055, 54201, 2856) = 2856 


Tabloul m este dat în Figura 8.2. 


Să calculăm acum eficiența acestei metode. Pentru s > 0, sunt n—s elemente de 


(diferite valori posibile ale lui k). Timpul de execuție este atunci în ordinul exact 
al lui 


n-l 


n-—l n-—l 
X n-s)s =n} s- } s’ =n’ (n-1)/2-n(n-1X{2n-1)/6 = (n° —n)/6 


s=1 s=1 s=1 
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s=3 
2 

s=2 
3 

s=1 
4 

s=0 


Figura 8.2 Exemplu de înmulţire înlănțuită a unor matrici. 


. . Esik 3 : v : 

Timpul de execuție este deci în O(n), ceea ce reprezintă un progres remarcabil 
= . > Dev» e. . . * 
faţă de metoda exponențială care verifică toate parantezările posibile . 


Prin această metodă, îl putem afla pe m[l, n]. Pentru a determina și cum să 
calculăm produsul M în cel mai eficient mod, vom mai construi un tablou 
r[l..n,1..n], astfel încât r[i, j] să conţină valoarea lui k pentru care este 
obţinută valoarea minimă a lui m[i, j]. Următorul algoritm construieşte tablourile 
globale m şi r. 


procedure minscal(d[O .. n]) 
for i — 1 ton do mli,il] —0 
for s< lton-l do 
for i — 1 to n-s do 
m[i, i+s] — +% 
for k + i to i+s-—l do 
q + m|i, k] + m[k+1, i+s] + d[i—1] d[k] d[i+s] 
if q < m[i, i+s] then mli, i+s] — q 
r[i, i+s] ek 


Produsul M poate fi obținut printr-un apel minmat(1, n) al algoritmului recursiv 


* Problema înmultțirii înlănțuite optime a matricilor poate fi rezolvată şi prin algoritmi mai eficienți. 
Astfel, T. C. Hu şi M. R. Shing au propus, (în 1982 şi 1984), un algoritm cu timpul de execuție în 
O(n log n). 
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function minmat(i, j) 


{returnează produsul matricial M; M;,, ... M; 


calculat prin m[i, j] înmulţiri scalare; 
se presupune că i <rļ[i, j] <j} 

if i = j then return M, 

arrays U, V 

U & minmat(i, rli, j]) 

V & minmat(rli, j]+1, j) 

return produs(U, V) 


unde funcția produs(U, V) calculează în mod clasic produsul matricilor U şi V. În 
exemplul nostru, produsul ABCD se va calcula în mod optim cu 2856 înmulţiri 
scalare, corespunzător parantezării: ((A(BC))D). 


8.4 Tablouri multidimensionale 


Implementarea operaţiilor cu matrici şi, în particular, a algoritmilor de înmulţire 
prezentaţi în Secţiunile 7.8 şi 8.3 necesită, în primul rând, clarificarea unor 
aspecte legate de utilizarea tablourilor în limbajele C şi C++. 


În privinţa tablourilor, limbajul C++ nu aduce nimic nou față de următoarele două 
reguli preluate din limbajul C: 


Din punct de vedere sintactic, noțiunea de tablou multidimensional nu există. 
Regula este surprinzătoare deoarece, în mod cert, putem utiliza tablouri 
multidimensionale. De exemplu, int a[2] [5] este un tablou multidimensional 
(bidimensional) corect definit, având două linii şi cinci coloane, iar a[1] [2] 
este unul din elementele sale, şi anume al treilea de pe a doua linie. Această 
contradicție aparentă este generată de o ambiguitate de limbaj: prin int 
a[2] [5] am definit, de fapt, două tablouri de câte cinci elemente. Altfel spus, 
a este un tablou de tablouri şi, ca o primă consecinţă, rezultă că numărul 
dimensiunilor unui “tablou multidimensional” este nelimitat. O altă consecință 
este chiar modalitatea de memorare a elementelor. Așa cum este normal, cele 
două tablouri (de câte cinci elemente) din a sunt memorate într-o zonă 
continuă de memorie, unul după altul. Deci, elementele tablourilor 
bidimensionale sunt memorate pe linii. În general, elementele tablourilor 
multidimensionale sunt memorate astfel încât ultimul indice variază cel mai 
rapid. 

Un identificator de tablou este, în același timp, un pointer a cărui valoare este 
adresa primului element al tabloului. Prin această regulă, tablourile sunt 
identificate cu adresele primelor lor elemente. De exemplu, identificatorul a de 
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Figura 8.3 Structura zonelor de memorie de la adresele a şi b. 


mai sus (definit ca int a[2][5]) este de tip pointer la un tablou cu cinci 
elemente întregi, adică int (*) [5], iar a[0] şi a[1] sunt adrese de întregi, 
adică int*. Mai exact, expresia a[0] este adresa primei linii din matrice (a 
primului tablou de cinci elemente) şi este echivalentă cu * (a+0), iar expresia 
a[1] este adresa celei de-a doua linii din matrice (a celui de-al doilea tablou 
de cinci elemente), adică *(a+1). În final, deducem că a[1][2] este 
echivalent cu * (* (a+1)+2), ceea ce ilustrează echivalența operatorului de 
indexare şi a celui de indirectare. 


În privinţa echivalenţei identificatorilor de tablouri şi a pointerilor, nu mai putem 
fi atât de categorici. Să pornim de la următoarele două definiţii: 


r 


im al e |L 5 | 
iot bi 2 1 = 4 

/i adica bl 0 1] = gal 0 
/i adica bl 1 ] 1 


I 
a 
i) 


unde a este un tablou de 2 x 5 elemente întregi, iar b este un tablou de două 
adrese de întregi. Structura zonelor de memorie de la adresele a şi b este 
prezentată în Figura 8.3. 


Evaluând expresia b[1] [2], obţinem * (* (b+1)+2), adică elementul a[1] [2], 
element adresat şi prin expresia echivalentă * (* (a+1) +2). Se observă că valoarea 
pointerului * (p+1) este memorată în al doilea element din b (de adresă b+1), în 
timp ce valoarea *(a+1), tot de tip pointer la int, nu este memorată, fiind 
substituită direct cu adresa celei de-a doua linii din a. Pentru sceptici, programul 
următor ilustrează aceste afirmaţii. 
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tinclude <iostream.h> 


main( ) { 
int al 2 1L $ l} 
int *p[ 2 |] = {alt lp ali ] J}; 


al 
1 
return 1; 


Tratarea diferită a expresiilor echivalente * (p+1) şi * (a+1) se datorează faptului 
că identificatorii de tablouri nu sunt de tip pointer, ci de tip pointer constant. 
Valoarea lor nu poate fi modificată, deoarece este o constantă rezultată în urma 
compilării programului. Astfel, dacă definim 


char x[ ] "algoritm! e 
char *y = "eficient"; 


atunci x este adresa unei zone de memorie care conține textul “algoritm”, iar y 
este adresa unei zone de memorie care conține adresa șirului “eficient”. 


Expresiile x[1], * (x+1) şi expresiile y[1], *(y+1) sunt corecte, valoarea lor 
fiind al doilea caracter din şirurile “algoritm” şi, respectiv, “eficient”. În schimb, 
dintre cele două expresii * (++x) şi * (++y), doar a doua este corectă, deoarece 
valoarea lui x nu poate fi modificată. 


Prin introducerea claselor şi prin posibilitatea de supraîncărcare a operatorului 
[], echivalenţa dintre operatorul de indirectare * şi cel de indexare [] nu mai este 
valabilă. Pe baza definiţiei 


int D = 8192; 
i 


tabloidint> x( D Jj 


putem scrie oricând 


for { int i = 0; i < De ift ) x] i ] = ij 
dar nu şi 
tör ( i s= 0 1 E De itt) "(xta = 43 


deoarece expresia x+i nu poate fi calculată. Cu alte cuvinte, identificatorii de tip 
tablou<T> nu mai sunt asimilați tipului pointer. Intr-adevăr, identificatorul x, 
definit ca tablou<float> x( D ), nu este identificatorul unui tablou predefinit, 
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ci al unui tip definit utilizator, tip care, întâmplător, are un comportament de 
tablou. Dacă totuşi dorim ca expresia * (x+i) să fie echivalentă cu x[i], nu avem 
decât să definim în clasa tablou<T> operatorul 


template <class T> 
T* operator +( tablouir>6 t; Int d) | 
return SEIL i ]; 


) 


In continuare, ne întrebăm dacă avem posibilitatea de a defini tablouri 
multidimensionale prin clasa tablou<T>, fără a introduce un tip nou. Răspunsul 
este afirmativ și avem două variante de implementare: 


e Orice clasă permite definirea unor tablouri de obiecte. În particular, pentru 
clasa tablou<T>, putem scrie 


tablousint> cf 3 1? 


ceea ce înseamnă că c este un tablou de trei elemente de tip tablou<int>. 
Iniţializarea acestor elemente se realizează prin specificarea explicită a 
argumentelor constructorilor. 


); // un tablou de 5 d lment 
] = { tablou<int>( x ); 
tablou<int>( 9 ) 
); 


tablou<int> x 


( 5 
tabloucint> e 3 


În acest exemplu, primul element se iniţializează prin constructorul de copiere, 
al doilea prin constructorul cu un singur argument int (numărul elementelor), 
iar al treilea prin constructorul implicit. În expresia c[1] [4], care se referă la 
al cincilea element din cea de-a doua linie, primul operator de indexare folosit 
este cel predefinit, iar al doilea este cel supraîncărcat în clasa tablou<T>. Din 
păcate, c este în cele din urmă tot un tablou predefinit, având deci toate 
deficiențele menţionate în Secţiunea 4.1. În particular, este imposibil de 
verificat corectitudinea primului indice, în timp ce verificarea celui de-al 
doilea poate fi activată selectiv, pentru fiecare linie. 


e O a doua modalitate de implementare a tablourilor multidimensionale 
utilizează din plin facilităţile claselor parametrice. Prin instrucţiunea 


tablou< tablousint> > d( 3 Jj 


obiectul d este definit ca un tablou cu trei elemente, fiecare element fiind un 
tablou de int. 

Problema care apare aici este cum să dimensionăm cele trei tablouri membre, 
tablouri inițializate prin constructorul implicit. Nu avem nici o modalitate de a 
specifica argumentele constructorilor (ca şi în cazul alocării tablourilor prin 
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operatorul new), unica posibilitate rămânând atribuirea explicită sau funcția de 
modificare a dimensiunii (redimensionare). 


TADBLOMRIREA x 25 Jy 

tablou< tabloucint> > d( 3 )ș 

Al 0 ] = 7 // prima linie se initializeaza cu x 

d[ 1 ].newsize( 16 ); // a doua linie se redimensioneaza 
// a treia linie nu se modifica 


Adresarea elementelor tabloului d constă în evaluarea expresiilor de genul 
d[1] [4], unde operatorii de indexare [] sunt, de această dată, ambii din clasa 
parametrică tablou<T>. În consecinţă, activarea verificărilor de indici poate fi 
invocată fie prin d.vOn (), pentru indicele de linie, fie separat în fiecare linie, 
prin d[i] .vOn(), pentru cel de coloană. 


În anumite situaţii, tablourile multidimensionale definite prin clasa parametrică 
tablou<T> au un avantaj important faţă de cele predefinite, în ceea ce priveşte 
consumul de memorie. Pentru fixarea ideilor, să considerăm tablouri 
bidimensionale, adică matrici. Dacă liniile unei matrici nu au acelaşi număr de 
elemente, atunci: 


e În tablourile predefinite, fiecare linie este de lungime maximă. 


e În tablourile bazate pe clasa tablou<T>, fiecare linie poate fi dimensionată 
corespunzător numărului efectiv de elemente. 


O matrice este triunghiulară, atunci când doar elementele situate de-o parte a 
diagonalei principale” sunt efectiv utilizate. În particular, o matrice triunghiulară 
este inferior triunghiulară, dacă foloseşte numai elementele de sub diagonala 
principală şi superior trunghiulară, în caz contrar. Matricile trunghiulare au deci 
nevoie numai de aproximativ jumătate din spaţiul necesar unei matrici obişnuite. 


Tablourile bazate pe clasa tablou<T> permit implementarea matricilor 
triunghiulare în spațiul strict necesar, prin dimensionarea corespunzătoare a 
fiecărei linii. Pentru tablourile predefinite, acest lucru este posibil doar prin 
utilizarea unor artificii de calcul la adresarea elementelor. 


8.5 Determinarea celor mai scurte drumuri într-un 
graf 


Fie G = <V, M> un graf orientat, unde V este mulțimea vârfurilor şi M este 
mulțimea muchiilor. Fiecărei muchii i se asociază o lungime nenegativă. Dorim să 
calculăm lungimea celui mai scurt drum între fiecare pereche de vârfuri. 


* Diagonala principală este diagonala care uneşte colţul din stânga sus cu cel din dreapta jos. 
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Vom presupune că vârfurile sunt numerotate de la 1 la n și că matricea L dă 
lungimea fiecărei muchii: L[i,i]=0, L[i,j] 2 0 pentru izj, L[i,j] =+% dacă 
muchia (i, j) nu există. 


Principiul optimalităţii este valabil: dacă cel mai scurt drum de la i la j trece prin 
vârful k, atunci porţiunea de drum de la i la k, cât şi cea de la k la j, trebuie să fie, 
de asemenea, optime. 


Construim o matrice D care să conţină lungimea celui mai scurt drum între fiecare 
pereche de vârfuri. Algoritmul de programare dinamică inițializează pe D cu L. 
Apoi, efectuează n iterații. După iteraţia k, D va conţine lungimile celor mai 
scurte drumuri care folosesc ca vârfuri intermediare doar vârfurile din 
(1,2, ..., k}. După n iterații, obţinem rezultatul final. La iteraţia k, algoritmul 
trebuie să verifice, pentru fiecare pereche de vârfuri (i, j), dacă există sau nu un 
drum, trecând prin vârful k, care este mai bun decât actualul drum optim ce trece 
doar prin vârfurile din (1,2, ..., k-1}. Fie D, matricea D după iteraţia k. 


Verificarea necesară este atunci: 
Dli, j] = min(D li j], Dyli, k] + Dak 


unde am făcut uz de principiul optimalității pentru a calcula lungimea celui mai 
scurt drum via k. Implicit, am considerat că un drum optim care trece prin k nu 
poate trece de două ori prin k. 


Acest algoritm simplu este datorat lui Floyd (1962): 


function Floyd(L[1 .. n, 1 ..n]) 

array D|[l ..n,l..n] 
DeL 
for k + 1 ton do 

for i — 1 ton do 

for j — 1 ton do 
D[i, j] — min(Dli, j], DLi, k]+D[k, jl) 

return D 
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De exemplu, dacă avem 


0 5 œ œ 
50 0 15 5 
D=L= 
30 œ% 0 15 
15 œ% 5 0 
obținem succesiv 

0 5 o æ 0 5 20 10 
50 0 15 5 50 0 15 5 

D, = D, = 
30 35 0 15 30 35 0 15 
15 20 5 0 15 20 5 0 
0 5 20 10 0 5 15 10 
45 0 15 5 20 0 10 5 

D, = D, = 
30 35 0 15 30 35 0 15 
15 20 5 0 15 20 5 0 


Puteți deduce că algoritmul lui Floyd necesită un timp în O(n’). Un alt mod de a 
rezolva această problemă este să aplicăm algoritmul Dijkstra (Capitolul 6) de n 
ori, alegând mereu un alt vârf sursă. Se obține un timp în n O(n’, adică tot în 
O(n’). Algoritmul lui Floyd, datorită simplităţii lui, are însă constanta 
multiplicativă mai mică, fiind probabil mai rapid în practică. Dacă folosim 
algoritmul Dijkstra-modificat în mod similar, obținem un timp total în 
O(max(mn, n?) log n), unde m = #M. Dacă graful este rar, atunci este preferabil să 


aplicăm algoritmul Dijkstra-modificat de n ori; dacă graful este dens (m = n°), 
este mai bine să folosim algoritmul lui Floyd. 


De obicei, dorim să aflăm nu numai lungimea celui mai scurt drum, dar și traseul 
său. In acestă situație, vom construi o a doua matrice P, inițializată cu zero. Bucla 
cea mai interioară a algoritmului devine 


if D[i, k]+D[k, j] < D[i, j] then  D[i, j] e D[i, k]+D[k, j] 
Pli,jlek 


Când algoritmul se opreşte, P[i, j] va conţine vârful din ultima iteraţie care a 
cauzat o modificare în D[i, j]. Pentru a afla prin ce vârfuri trece cel mai scurt 
drum de la i la j, consultăm elementul P[i, j]. Dacă P[i, j] = 0, atunci cel mai scurt 
drum este chiar muchia (i, j). Dacă P[i, j] = k, atunci cel mai scurt drum de la i la 
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Figura 8.4 Un arbore binar de căutare. 


j trece prin k şi urmează să consultăm recursiv elementele P[i, k] şi P[k, j] pentru 
a găsi şi celelalte vârfuri intermediare. 


Pentru exemplul precedent se obține 


0 0 4 2 

4 0 4 0 
P= 

0 1 0 0 

0 1 0 0 


Deoarece P[I, 3] = 4, cel mai scurt drum de la 1 la 3 trece prin 4. Deoarece 
P[I, 4] = 2, cel mai scurt drum de la 1 la 4 trece prin 2. Rezultă că cel mai scurt 
drum de la 1 la 3 este: 1,2,4,3. 


8.6 Arbori binari optimi de căutare 


Un arbore binar în care fiecare vârf conţine o valoare (numită cheie) este un 
arbore de căutare, dacă cheia fiecărui vârf neterminal este mai mare sau egală cu 
cheile descendenților săi stângi și mai mică sau egală cu cheile descendenților săi 
drepți. Dacă cheile arborelui sunt distincte, aceste inegalităţi sunt, în mod evident, 
stricte. 


Figura 8.4 este un exemplu de arbore de căutare”, conținând cheile A, B, C,..., H. 
Vârfurile pot conţine şi alte informații (în afară de chei), la care să avem acces 
prin intermediul cheilor. 


ea a š A FA . e me $ . 
În această secțiune vom subînţelege că toți arborii de căutare sunt binari. 
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Figura 8.5 Un alt arbore binar de căutare. 


Această structură de date este utilă, deoarece permite o căutare eficientă a 
valorilor în arbore (Exerciţiul 8.10). De asemenea, este posibil să actualizăm un 
arbore de căutare (să ştergem un vârf, să modificăm valoarea unui vârf, sau să 
adăugăm un vârf) într-un mod eficient, fără să distrugem proprietatea de arbore de 
căutare. 


Cu o mulțime dată de chei, se pot construi mai mulți arbori de căutare (Figura 
8.5). 


Pentru a căuta o cheie X în arborele de căutare, X va fi comparată la început cu 
cheia rădăcinii arborelui. Dacă X este mai mică decât cheia rădăcinii, atunci se 
continuă căutarea în subarborele stâng; dacă X este egală cu cheia rădăcinii, 
atunci căutarea se încheie cu succes; dacă X este mai mare decât cheia rădăcinii, 
atunci se continuă căutarea în subarborele drept. Se continuă apoi recursiv acest 
proces. 


De exemplu, în arborele din Figura 8.4 putem găsi cheia E prin două comparații, 
în timp ce aceeaşi cheie poate fi găsită în arborele din Figura 8.5 printr-o singură 
comparaţie. Dacă cheile A, B, C, ..., H au aceeaşi probabilitate, atunci pentru a 
găsi o cheie oarecare sunt necesare în medie: 


(2+3+1+3+2+4+3+4)/8 = 22/8 comparații, pentru arborele din Figura 8.4 
(4+3+2+3+14+3+2+3)/8 = 21/8 comparații, pentru arborele din Figura 8.5 


Când cheile sunt echiprobabile, arborele de căutare care minimizează numărul 
mediu de comparații necesare este arborele de căutare de înălțime minimă 
(demonstrați acest lucru şi găsiți o metodă pentru a construi arborele respectiv!). 


Vom rezolva în continuare o problemă mai generală. Să presupunem că avem 
cheile c} < c, <... < c, şi că, în tabloul p, p[i] este probabilitatea cu care este 


căutată cheia c, 1 <i <n. Pentru simplificare, vom considera că sunt căutate doar 


cheile prezente în arbore, deci că p[1]+p[2]+...+pln] = 1. Ne propunem să găsim 
arborele optim de căutare pentru cheile c}, cp, ..., C, adică arborele care 


m 


minimizează numărul mediu de comparații necesare pentru a găsi o cheie. 
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Problema este similară cu cea a găsirii arborelui cu lungimea externă ponderată 
minimă (Secţiunea 6.3), cu deosebirea că, de această dată, trebuie să menţinem 
ordinea cheilor. Această restricţie face ca problema găsirii arborelui optim de 
căutare să fie foarte asemănătoare cu problema înmulțirii înlănţuite a matricilor. 
În esenţă, se poate aplica acelaşi algoritm. 


Dacă o cheie c, se află într-un vârf de adîncime d, atunci sunt necesare d,+l 
comparații pentru a o găsi. Pentru un arbore dat, numărul mediu de comparații 
necesare este 


n 


© plil(d; +1) 


i=1 
Dorim să găsim arborele pentru care acest număr este minim. 
Vom rezolva această problemă prin metoda programării dinamice. Prima decizie 
constă în a determina cheia c, a rădăcinii. Să observăm că este satisfăcut 
principiul optimalității: dacă avem un arbore optim pentru c}, Cp, ..., €, Şi cu cheia 
c, în rădăcină, atunci subarborii săi stâng şi drept sunt arbori optimi pentru cheile 
Mai general, într-un arbore optim 


Cis Cos -e-s Crop TESPECUV Chpjo Chaos 1o Cwe 


conținând cele n chei, un subarbore oarecare este la rândul său optim pentru o 


secvență de chei succesive c; Chp -> Cpi <j. 


În tabloul C, să notăm cu C[i, j] numărul mediu de comparații efectuate într-un 
subarbore care este optim pentru cheile c; C4 >o Cp atunci când se caută o cheie 
X în arborele optim principal. Valoarea 


m[i, j] = pli] + pli+1] + ... + p[ j] 


este probabilitatea ca X să se afle în secvența c; Cap -o c, Fie c, cheia rădăcinii 
subarborelui considerat. Atunci, probabilitatea comparării lui X cu c, este m[i, j], 


şi avem: 
C[i, j] = m[i, j] + Cli, k—1] + C[k+1, j] 


Pentru a obține schema de programare dinamică, rămîne să observăm că c, (cheia 
rădăcinii subarborelui) este aleasă astfel încât 


Cli, j] = ml[i, j] + min (C[i, k—-1]+C[k+1, j]) (*) 


i<k<j 


În particular, C[i, i] = p[i] şi C[i, i-l] = 0. 


Dacă dorim să găsim arborele optim pentru cheile c} < c, <... <C cu 
probabilitățile 


Secţiunea 8.6 Arbori binari optimi de căutare 203 


pll] = 0,30 pl21=0,05 p[3]= 0,08 
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calculăm pentru început matricea m: 
0,30 0,35 0,43 0,88 
0,05 0,13 0,58 
m= 0,08 0,53 
0,45 


1,00 
0,70 
0,65 
0,57 
0,12 


Capitolul 8 


Să notăm că Cļ[i, i] = pli], 1<i<5. Din relația (*), calculăm celelalte valori 


pentru C[i, j]: 


C[1, 2] = m[1, 2] + min(C[1, 0]+C[2, 2], C[1, 1]+C[3, 2]) 


= 0,35 + min(0,05, 0,30) = 0,40 


Similar, 


C[2, 3] = 0,18 C[3, 4] = 0,61 C[4, 5] = 0,69 


Apoi, 


C[1, 3] = m[1, 3] + min(C[1, 0]+C[2, 3], C[1, 1]+C[3, 3], C[1, 2]+C[4, 3]) 


= 0,43 + min(0,18, 0,38, 0,40) = 0,61 
C[2, 4] = 0,76 C[3, 5] = 0,85 
CI, 4] = 1,49 C[2, 5] = 1,00 


C[1, 5] = m[1, 5] + min(C[1, 0]+C[2, 5], C[1, 1]+C[3, 5], C[1, 2]+C[4, 5], 


C[1, 3]+C[5, 5], C[1, 4]+C1[6, 5]) = 1,73 


Arborele optim necesită deci în medie 1,73 comparații pentru a găsi o cheie. 


În acest algoritm, calculăm valorile C[i, j] în primul rând pentru j-i = 1, apoi 
pentru j-i = 2 etc. Când j-i = q, avem de calculat n-q valori ale lui C[i, j], fiecare 


n-—l 
e (n-qXq+1))=0(n°) 


q=l 


Ştim acum cum să calculăm numărul minim de comparații necesare pentru a găsi o 
cheie în arborele optim. Mai rămâne să construim efectiv arborele optim. In 


* Dacă ţinem cont de îmbunătățirile propuse de D. E. Knuth (“Tratat de programarea 


calculatoarelor. Sortare şi cău ”, Secţiunea 6.2.2), acest algoritm de construire a arborilor 
alculatoarelor. Sortare şi căutare t 


optimi de căutare poate fi făcut pătratic. 
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Figura 8.6 Un arbore optim de căutare. 


paralel cu tabloul C, vom construi tabloul r, astfel încât r[i, j] să conţină valoarea 
lui k pentru care este obținută în relația (*) valoarea minimă a lui C[i, j], unde 
i < j. Generăm un arbore binar, conform următoarei metode recursive: 


e rădăcina este etichetată cu (1, n) 

e dacă un vârf este etichetat cu (i, j), i < j, atunci fiul său stâng va fi etichetat cu 
(i, r[i, jl- 1) şi fiul său drept cu (r[i, j]+1, j) 

e vârfurile terminale sunt etichetate cu (i, i) 


Plecând de la acest arbore, arborele de căutare optim se obţine schimbând 
etichetele (i, j), i < j, în Cui, jp ar etichetele (i, i) în c;. 
Pentru exemplul precedent, obținem astfel arborele optim din Figura 8.6. 


Problema se poate generaliza, acceptând să căutăm şi chei care nu se află în 
arbore. Arborele optim de căutare se obţine în mod similar. 


8.7 Arborii binari de căutare ca tip de dată 


Într-o primă aproximare, arborele binar este un tip de dată similar tipului listă. 
Vârfurile sunt compuse din informaţie (cheie) şi legături, iar arborele propiu-zis 
este complet precizat prin adresa vârfului rădăcină. În privinţa organizării 
memoriei, putem opta fie pentru tablouri paralele, ca în Exerciţiul 8.10, fie pentru 
alocarea dinamică a elementelor. Alegând alocarea dinamică, vom utiliza în 
întregime modelul oferit de clasa lista<E> elaborată în Secţiunea 4.3. Astfel, 
clasa parametrică arbore<E>, cu o structură internă de forma: 
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template <class E> 
class arbore { 


Į} axe declaratii friend 
public: 
arbore( ) { root = 0; n= 0; } 
If ass functii membre 
private: 
varf<E> *root; // adresa varfului radacina 
int nf // numarul varfurilor din arbore 


); 


are la bază o clasă privată varf<E> prin intermediul căreia vom implementa 
majoritatea operaţiilor efectuate asupra arborilor. Vom căuta să izolăm, ori de 
câte ori va fi posibil, operaţiile direct aplicabile vârfurilor, astfel încât interfața 
dintre cele două clase să fie foarte clar precizată printr-o serie de “operaţii 
elementare”. 


Nu vom implementa în această secțiune arbori binari în toată generalitatea lor, ci 
doar arborii de căutare. Obiectivul urmărit în prezentarea listelor a fost structura 
de date în sine, împreună cu procedurile generale de manipulare. În cazul 
arborelui de căutare, nu mai este necesară o astfel de generalitate, deoarece vom 
implementa direct operaţiile specifice. În mare, aceste operaţii pot fi împărţite în 
trei categorii: 


e Căutări. Localizarea vârfului cu o anumită cheie, a succesorului sau 
predecesorului lui, precum şi a vârfurilor cu cheile de valoare maximă, 
respectiv minimă. 

e Modificări. Arborele se modifică prin inserarea sau ştergerea unor vârfuri. 


e Organizări. Arborele nu este construit prin inserarea elementelor, ci global, 
stabilind într-o singură trecere legăturile dintre vârfuri. Frecvent, organizarea 
se face conform unor criterii pentru optimizarea căutărilor. Un caz particular al 
acestei operaţii este reorganizarea arborelui după o perioadă suficient de mare 
de utilizare. Este vorba de reconstruirea arborelui într-o structură optimă, pe 
baza statisticilor de utilizare. 


Datorită operaţiilor de căutare şi modificare, elementele de tip E trebuie să fie 
comparabile prin operatorii uzuali ==, !=, >. În finalul Secţiunii 7.4.1, am arătat 
că o asemenea pretenţie nu este totdeauna justificată. Desigur că, în cazul unor 
structuri bazate pe relaţia de ordine, așa cum sunt heap-ul şi arborele de căutare, 
este absolut normal ca elementele să poată fi comparate. 


Principalul punct de interes pentru noi este optimizarea, conform algoritmului de 
programare dinamică. Nu vom ignora nici căutările, nici operaţiile de modificare 
(tratate în Secţiunea 8.7.2). 
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8.7.1 Arborele optim 


Vom rezolva problema obţinerii arborelui optim în cel mai simplu caz posibil (din 
punct de vedere al utilizării, dar nu şi în privinţa programării): arborele deja 
există şi trebuie reorganizat într-un arbore de căutare optim. Având în vedere 
specificul diferit al operațiilor de organizare față de celelalte operaţii efectuate 
asupra grafurilor, am considerat util să încapsulăm optimizarea într-o clasă pe 
care o vom numi “structură pentru optimizarea arborilor” sau, pe scurt, s8a. 


Clasa s8a este o clasă parametrică privată, asociată clasei arbore<E>. 
Funcţionalitatea ei constă în: 


i)  inițializarea unui tablou cu adresele vârfurilor în ordinea crescătoare a 
probabilităților cheilor 


ii) stabilirea de noi legături între vârfuri astfel încât arborele să fie optim. 


Principalul motiv pentru care a fost aleasă această implementare este că sunt 
necesare doar operaţii modificare a legăturilor. Deplasarea unui vârf (de exemplu, 
pentru sortare) înseamnă nu numai deplasarea cheii, ci și a informaţiei asociate. 
Cum fiecare din aceste elemente pot fi oricât de mari, clasa s8a realizează o 
economie semnificativă de timp şi (mai ales) de memorie. 


Pentru optimizarea propriu-zisă, am implementat atât algoritmul de programare 
dinamică, cât şi pe cel greedy prezentat în Exerciţiul 8.12. Deşi algoritmul greedy 
nu garantează obţinerea arborelui optim, el are totuşi avantajul că este mai 
eficient decât algoritmul de programare dinamică din punct de vedere al timpului 
de execuţie şi al memoriei utilizate. Invocarea optimizării se realizează din clasa 
arbore<E>, prin secvenţe de genul 


arbore<float> af; 


// arborele af se creeaza prin inserarea cheilor 
// arborele af se utilizeaza 


// pe baza probabilitatilor predefinite si actualizate 
// prin utilizarea arborelui se invoca optimizarea 


af.re_prodin( ); // sau af.re greedy( ); 


unde funcţiile membre re_greedy () şi re prodin () sunt definte astfel: 


template <class E> 
arbore<E>& arbore<E>::re_greedy( ) { 
// reorganizare prin metoda greedy 
s8a<E> opt( root, n ); 
root = opt.greedy( ); 
return *this; 
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template <class E> 
arbore<E>& arbore<E>::re_prodin( ) { 
// reorganziare prin programare dinamica 


După 


sta<Ek> opt( root, n ); 
root = opt.prodin( ); 
return *this; 


adăugarea tuturor funcţiilor şi datelor membre necesare implementării 


funcțiilor greedy () şi prodin (), clasa s8a are următoarea structură: 


template <class E> 


class s8a { // clasa pentru construirea arborelui optim 
friend class arbore<E>; 
private: 
s8a( varf<E> *root, int nn ): pvarf( n =nn) 4 
int i = 0; // indice in pvarf 


); 


setvarf ( i, root ); // setarea elementelor din pvarf 


) 


// initializarea tabloului pvarf cu un arbore deja format 
void setvarf( int&, varf<E>* ); 


varf<E>* greedy( ) { // "optim" prin algoritmul greedy 
return _greedy( 0, n); 


) 

varf<E>* prodin( ) ( // optim prin programare dinamica 
_preogDininiti )ș return _progDini 0p n > 1 f3 

) 


// functiile prin care se formeaza efectiv arborele 


varf<E>* _greedy | Intz int Jý 
varf<Ek>* _progDin | intay inte Jý 
võid -progDinInit{ jy // initializeaza tabloul r 


// date membre 
tablou<varf<E>*> pvarf; // tabloul adreselor varfurilor 
int ñy // numarul varfurilor din arbore 


// tabloul indicilor necesar alg. de programare dinamica 
tablou< tablous<sint> > Yi 
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În stabilirea valorilor tablourilor pvarf şi r se pot distinge foarte clar cele două 
etape ale execuţiei constructorului clasei s8a, etape menţionate în Secţiunea 
4.2.1. Este vorba de etapa de iniţializare (implementată prin lista de iniţializare a 
membrilor) şi de etapa de atribuire (implementată prin corpul constructorului). 
Lista de iniţializare asociată constructorului clasei s8a conţine parametrul necesar 
dimensionării tabloului pvarf pentru cele n elemente ale arborelui. Cum este însă 
iniţializat tabloul r care nu apare în lista de iniţializare? În astfel de cazuri, se 
invocă automat constructorul implicit (apelabil fără nici un argument) al clasei 
respective. Pentru clasa tablou<T>, constructorul implicit doar inițializează cu 0 
datele membre. 


Etapa de atribuire a constructorului clasei s8a, implementată prin invocarea 
funcţiei setvarf (), constă în parcurgerea arborelui şi memorarea adreselor 
vârfurilor vizitate în tabloul pvarf. Funcţia setvarf () parcurge pentru fiecare 
vârf subarborele stâng, apoi memorează adresa vârfului curent şi, în final, 
parcurge subarborele drept. După cum vom vedea în Exerciţiul 9.1, acest mod de 
parcurgere are proprietatea că elementele arborelui sunt parcurse în ordine 
crescătoare. De fapt, este vorba de o metodă de sortare similară guicksort-ului, 
vârful rădăcină având acelaşi rol ca şi elementul pivot din quicksort. 


template <class E> 
void s8a<E>::setvarf( inté poz, varf<E>* x) { 


ir (xj {i 
setvarf( poz, x->st ); 
pvarf[ pozr+ ] = x; 


setvarf( poz, x->dr ); 


// anulam toate legaturile elementului x 
x=>8E x->dr x=->tata 0; 


În această funcţie, x—>st, x->dr şi x->tata sunt legăturile vârfului curent x către 
fiul stâng, către cel drept şi, respectiv, către vârful tată. În plus faţă de aceste 
legături, obiectele de tip varf<E> mai conţin cheia (informaţia) propriu-zisă şi un 
câmp auxiliar pentru probabilitatea vârfului (elementului). În consecință, clasa 
varf<E> are următoarea structură: 
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friend class arbores<! 
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E> 


friend class s8a<E>; 


private: 
varf ( const E& v; float f = 0 ): key( v) 
{BE dr tata 0; p fy } 
varf<E> *st; // adresa fiului stang 
varf<E> xdr; // adresa fiului drept 
varf<E> *tata; // adresa varfului tata 
E key; // cheia 
float p; // frecventa utilizarii cheii curente 


); 


Implementarea celor două metode de optimizare a arborelui urmează pas cu pas 


algoritmul greedy şi, 


respectiv, algoritmul de programare dinamică. Ambele 


(re )stabilesc legăturile dintre vârfuri printr-un proces recursiv, pornind fie direct 
de la probabilitățile elementelor, fie de la o matrice (matricea r) construită pe 


baza acestor probabili 
_greedy (), sunt urmă 


template <class 
varf<E>* s8a<E>: 


tăți. Funcţiile care stabilesc legăturile, adică _progDin () şi 
toarele: 


E> 
:_greedy( int m, 


int M) | 


// m si M sunt limitele subsecventei curente 


if (m==M) 


return 0; 


// se determina pozitia k a celei mai frecvente chei 


IAE ki 
for {( int i 
if ( pyarfi 


// se selectea 
varf<E> *actua 


// se construi 
7/1 se initiali 
if ( (actual-> 
aetual=>st=> 

( (actual-> 
aetual=s(r= 


irf 


// subarborele 
return actual; 


float pmax = pvarf[ k = m ]->p; 
mi +I < ME ) 
i ]->p > pmax ) pmax = pvarf| k= i ]->p; 


za adresa varfului de pe pozitia k 
1 pvarf[ k |]; 


esc subarborii din stanga si din deapta 
zeaza legatura spre varful tata 


st = _greedy( m, k )) != 0) 
tata = actual; 
dr = _greedy( k + 1, M )) != 0 ) 
tata = actual; 


curent este gata; se returneaza adresa lui 
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template <class E> 

varf<E>* s8a<E>:: _progDin( int i; int 3) 4 
// i si j, i <=j, sunt coordonatele radacinii 
//  subarborelui curent in tabloul r 
i£ { i >] ) ceturn 0; 


// se selecteaza adresa varfului radacina 
varf<E> *actual = pvyarf[ ri J ID å 1 ]7 


if (i 1s j } i 77 daca nu este un varf frunza 
// se construiesc subarborii din stanga si din deapta 
// se initializeaza legatura spre varful tata 


if | (actual->st = _proaDini ip r[J] [il] = 1 )) = 0) 
actual->st->tata = actual; 
if { (actual->dr = _proaDini r[jlLi] + 1, ])) !=0) 


actual->ădr=>tata = actual; 


) 


// subarborele curent este gata; se returneaza adresa lui 
return actual; 


Folosind notaţiile introduse în descrierea algoritmului de optimizare prin 
programare dinamică, funcţia _progDinInit () construieşte matricea r, unde 
r[i] [3], i < j, este indicele în tabloul pvarf al adresei vârfului etichetat cu 
(îi, 3). În acest scop, se foloseşte o altă matrice C, unde C[i] [j], i < j, este 
numărul de comparații efectuate în subarborele optim al cheilor cu indicii i, ..., 3. 
Iniţial, C este completată cu probabilitățile cumulate ale cheilor de indici i, ..., 3. 


Se observă că matricile r şi C sunt superior triunghiulare. Totuşi, pentru 
implementare, am preferat să lucrăm cu matrici inferior triunghiulare, adică cu 
transpusele matricilor r şi C, deoarece adresarea elementelor ar fi fost altfel mai 
complicată. 


template <class E> 
void s8a<E>::_progDiniInit( y { 
inë ip jy d 
tablou< tablou<float> > C; // tabloul C este local 


// redimensionarea si initializarea tablourilor C si r 

// ATENTIE! tablourile C si r sunt TRANSPUSE. 

r.newsize(n ); 

C.newsize( n ); 

POL (i = pè 2 e n7 art} 
r[ i ]-newsize( i + 1); 
C[ i ]-ñewsize( i +1) 


} 


| > 44 
] pvarf[ i ]->p; 
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// pentru inceput C este identic cu m 
for (d = 1ș d < n; dtt ) 
for (1i = 0y (J= i +09) <n; i++ ) 
H SSE e E De SL IL a 1 


// elementele din C se calculeaza pe diagonale 
for (d = I; d< n; di+ ) 
fot | a = 0 Q= Lead <n; i++] 4 
77 in calculul minimului dintre C[i] [k=>=1]+C[k+1] [3] 
// consideram mai intai cazurile k=i si k=j in care 
// avem C[i][i-1] = 0 si C[j+1][j] = 0 
int ki float Cminy 
if {CCJ late Ls CI jo IL i} 
Cmin = Cl 3 J[ (k = 1) + 1 ]} 


else 
Emin = Cl (k= j) = 1 IL i]; 
// au mai ramas de testat elementele i+1, ..., j-1 


for { ingt L= i + 1y 1 € Jy 1+) 
if ( C&T Jp ai] +C aJt ALAJ] a Emin) 
Cmin = C Ss 1) = LILI] e CL IL Le 1 15 


// minimul si pozitia lui sunt stabilite 
C[ j IL i ] += Cmin; 
ELI IL a] = 


8.7.2 Căutarea în arbore 


Principala operaţie efectuată prin intermediul arborilor binari de căutare este 
regăsirea informației asociate unei anumite chei. Funcţia de căutare search () are 
ca argument cheia pe baza căreia se va face căutarea şi returnează false sau true, 
după cum cheia fost regăsită, sau nu a fost regăsită în arbore. Când căutarea s-a 
terminat cu succes, valoarea din arbore a cheii regăsite este returnată prin 
intermediul argumentului de tip referință, pentru a permite consultarea 
informaţiilor asociate. 


template <class E> 


int arbore<E>::search( E& k ) | 
varf<f> *x = _searchi root, k ); 
iE AU Se return 0; // element absent 
x=>pt+; // actualizarea frecventei 


k = x->key; return 1; 


Actualizarea probabilităților cheilor din arbore, după fiecare operaţie de căutare, 
este ceva mai delicată, deoarece impune stabilirea importanţei evaluărilor 
existente în raport cu rezultatele căutărilor. De fapt, este vorba de un proces de 
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învăţare care porneşte de la anumite cunoştinţe deja acumulate. Problema este de 
a stabili gradul de importanţă al cunoştinţelor existente în raport cu cele nou 
dobândite. Înainte de a prezenta o soluţie elementară a acestei probleme, să 
observăm că algoritmii de optimizare lucrează cu probabilităţi, dar numai ca 
ponderi. În consecință, rezultatul optimizării nu se schimbă, dacă în loc de 
probabilităţi se folosesc frecvenţe absolute. 


Fie trei chei ale căror probabilităţi de căutare au fost estimate iniţial la 0,18, 0,65, 
0,17. Să presupunem că se doreşte optimizarea arborelui de căutare asociat 
acestor chei, atât pe baza acestor estimări, cât şi folosind rezultatele a 1000 de 
căutări de instruire terminate cu succes . Dacă fixăm ponderea estimărilor iniţiale 
în raport cu rezultatele instruirii la 5/2, atunci vom inițializa membrul p 
(estimarea probabilității cheii curente) din clasa varf<E> cu valorile 


0,18 x 1000 x (5/2) = 450 
0,65 x 1000 x (5 / 2) = 1625 
0,17 x 1000 x (5/2) = 425 


Apoi, la fiecare căutare terminată cu success, membrul p corespunzător cheii 
găsite se incrementează cu 1. De exemplu, dacă prima cheie a fost găsită în 247 
cazuri, a doua în 412 cazuri și a treia în 341 cazuri, atunci valorile lui p folosite 
la optimizarea arborelui vor fi 697, 2037 şi 766. Suma acestor valori este 3500, 
valoare care corespunde celor 1000 de încercări plus ponderea de 1000 x 
(5/2) = 2500 asociată estimării inițiale. Noile probabilități, învăţate prin 
instruire, sunt: 


697 / 3500 = 0,20 
2037 / 3500 = 0,58 
766 / 3500 = 0,22 


Pentru verificarea rezultatelor de mai sus, să refacem calculele, lucrând numai cu 
probabilități. Estimările inițiale ale probabilităților sunt 0,18, 0,65 şi 0,17. In 
urma instruirii, cele trei chei au fost căutate cu probabilitățile: 


247 / 1000 = 0,247 
412 / 1000 = 0,412 
697 / 1000 = 0,697 


* În procesul de optimizare pot fi implicate nu numai căutările terminate cu succes, ci şi cele 
nereuşite. Căutarea cheilor care nu sunt în arbore este tot atât de costisitoare ca şi căutarea celor 
care sunt în arbore. Pentru detalii asupra acestei probleme se poate consulta D. E. Knuth, “Tratat 
de programarea calculatoarelor. Sortare și căutare”, Secţiunea 6.2.2. 
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Având în vedere raportul de 5/2 stabilit între estimarea inițială şi rezultatele 
instruirii, probabilitățile finale sunt: 


(0,18 x 5 + 0,247 x 2) / 7 = 0,20 
(0,65 x 5 + 0,412 x 2) / 7 = 0,58 
(0,17 x 5 + 0,697 x 2) / 7 = 0,22 


Căutarea este, de fapt, o parcurgere a vârfurilor, realizată prin funcţia 
_search(varf<E>*, const E&). Această funcţie nu face parte din clasa 
arbore<E>, deoarece operează exclusiv asupra vârfurilor. lată varianta ei 
recursivă, împreună cu alte două funcţii asemănătoare: _min(), pentru 
determinarea vârfului minim din arbore şi _succ(), pentru determinarea 


succesorului". 


template <class E> 
varf<E>* _search( varf<E>* x, const E& k ) { 
while ( x != 0 && k != x->key ) 
X= E > Sky? SAE ss 
return x; 


) 


template <class E> 


varf<k>* _min( varf<B>t x ) {f 
while ( x->st != 0) 
x = x->st; 


return x; 


) 


template <class E> 
varf<ph>* _succl varfep>* x ) { 
if (| ode l= 0 ) return _mini *->dE ); 


varf<E> *y = x->tata; 

while (y != 0 && x == y->dr) 
| x > y; y > y->tataș |] 

return y? 


) 


Existenţa acestor funcții impune completarea clasei varf<E> cu declaraţiile 
friend corespunzătoare. 


* Acest procedeu de estimare a probabilităților printr-un proces de instruire poate fi formalizat 
într-un cadru matematic riguros (R. Andonie, “A Converse H-Theorem for Inductive Processes”, 
Computers and Artificial Intelligence, Vol. 9, 1990, No. 2, pp. 159-167). 


Succesorul unui vârf X este vârful cu cea mai mică cheie mai mare decât cheia vârfului X (vezi şi 
Exerciţiul 8.10). 
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Să remarcăm asemănarea dintre funcţiile C++ de mai sus şi funcţiile analoage din 
Exerciţiul 8.10. 


Pentru a demonstra corectitudinea funcţiilor _serarch() şi _min(), nu avem 
decât să ne reamintim că, prin definiţie, într-un arbore binar de căutare fiecare 
vârf K verifică relaţiile X < K şi K< Y pentru orice vârf X din subarborele stâng 
şi orice vârf Y din subarborele drept. 


Demonstrarea corectitudinii funcţiei _succ () este de asemenea foarte simplă. Fie 
K vârful al cărui succesor § trebuie determinat. Vârfurile K şi S pot fi situate 
astfel: 


e Vârful S este în subarborele drept al vârfului K. Deoarece aici sunt numai 
vârfuri Y cu proprietatea K < Y (vezi Figura 8.7a) rezultă că S este valoarea 
minimă din acest subarbore. În plus, având în vedere procedura pentru 
determinarea minimului, vârful S nu are fiul stâng. 


e Vârful K este în subarborele stâng al vârfului S. Deoarece fiecare vârf X de aici 
verifică inegalitatea X < S (vezi Figura 8.7b), deducem că maximul din acest 
subarbore este chiar K. Dar maximul se determină parcurgând fiii din dreapta 
până la un vârf fără fiul drept. Deci, vârful K nu are fiul drept, iar S este 
primul ascendent din stânga al vârfului K. 


In consecință, cele două situaţii se exclud reciproc, deci funcţia _succ() este 
corectă. 


(a) Vârful succesor S este (b) Vârful K este maxim în 
minim în subarborele drept subarborele stâng al 
al vârfului K. vârfului succesor S. 


Figura 8.7 Poziţiile relative ale vârfului K în raport cu sucesorul său S. 


216 Algoritmi de programare dinamică Capitolul 8 


8.7.3 Modificarea arborelui 


Modificarea structurii arborelui de căutare, prin inserarea sau ştergerea unor 
vârfuri trebuie realizată astfel încât proprietatea de arbore de căutare să nu se 
altereze. Cele două operaţii sunt diferite în privința complexității. Inserarea este 
simplă, fiind similară căutării. Ștergerea este mai dificilă şi mult diferită de 
operaţiile cu care deja ne-am obișnuit. 


Pentru inserarea unei noi chei, vom folosi funcția 


template <class E> 


int arbore<E>::ins( const E& k, float p } 4 
varf<E> *y = 0, *x = root; 
while ( x != 0) { 
yer 
if ( k == x->key ) { // cheia deja exista in arbore 
X=>p += p} // se actualizeaza frecventa 
return 0; // se returneaza cod de eroare 


} 
x= k > key? SP k->st; 


) 


// cheia nu exista in arbore 
varf<E> *z = new varf<E>( k, p ); 
z->tata = y} 


if ( y == 0 ) root = z>: 

else 1f { z->key > y->key |) ydr = z; 
else y->st = zZ} 

n++; // in arbore este cu un varf mai mult 


return 1; 


Valoarea returnată este true, dacă cheia k a putut fi inserată în arbore, sau false, 
în cazul în care deja există în arbore un vârf cu cheia k. Inserarea propriu-zisă 
constă în căutarea cheii k prin intermediul adreselor x şi y, y fiind adresa tatălui 
lui x. Atunci când am terminat procesul de căutare, valoarea lui x devine 0 şi noul 
vârf se va insera la stânga sau la dreapta lui y, în funcție de relația dintre cheia k 
şi cheia lui y. 


Procedura de ştergere începe prin a determina adresa z a vârfului de şters, pe baza 
cheii k. Dacă procesul de căutare se finalizează cu succes, cheia k se va actualiza 
(în scopul unor prelucrări ulterioare) cu informația din vârful z, iar apoi se 
demarează procesul de ştergere efectivă a vârfului z. Dacă z este un vârf terminal, 
nu avem decât să anulăm legătura corespunzătoare din vârful tată. Chiar şi atunci 
când z are un singur fiu, ştergerea este directă. Adresa lui z din vârful tată se 
înlocuieşte cu adresa fiului lui z. A treia şi cea mai complicată situație apare 
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Figura 8.8 Ştergerea vârfurilor E, A şi L dintr-un arbore binar de căutare. 
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atunci când z este situat undeva în interiorul arborelui, având ambele legături 
complete. În acest caz, nu vom mai şterge vârful z, ci vârful y, succesorul lui z, 
dar nu înainte de a copia conținutul lui y în z. Ştergerea vârfului y se face 
conform unuia din cele două cazuri de mai sus, deoarece, în mod sigur, y nu are 
fiul stâng. Într-adevăr, într-un arbore de căutare, succesorul unui vârf cu doi fii nu 
are fiul stâng, iar predecesorul” unui vârf cu doi fii nu are fiul drept (demonstrați 
acest lucru!). Pentru ilustrarea celor trei situații, am şters din arborele din Figura 
8.8a vârfurile E (vârf cu doi fii), A (vârf cu un fiu) şi L (vârf terminal). 


Procedura de ştergere se implementează astfel: 


template <class E> 
int arbore<E>::del( E& k ) { 


varf<E> *z = _search( root, k ); // se cauta cheia k 
if ( !2 ) returna 0; // nu a fost gasita 
==} // in arbore va fi cu un varf mai putin 

k = z->key; // k va retine intreaga informatie din z 
// — y este z daca z are cel mult un fiu si 

// succesorul lui z daca z are doi fii 

// - x este fiul lui y sau 0 daca y nu are fii 
vart<E> *y, *ip 


Predecesorul unui vârf X este vârful care are cea mai mare cheie mai mică decât cheia vârfului X. 
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a->at 
y=>st 


y 
x 


// se elimin 
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(0) 
0? 


| z->dr == 0? z: _succi z ); 
y=>st: y->dr}; 


a varful y din arbore astfel: 


// 1. se stabileste legatura in x spre varful tata 
if (z2 !=0 j 
x->tata = y->tata; 

// 2. in varful tata se stabileste legatura spre x 

if ( y->tata == ) root = x}; 

else if { y == y->tata->st ) y->tata->st = x} 
else y=>tata=->dr = žy 

fí 3. daca z are 2 fii, succesorul lui ii ia locul 

if | y l= z ) { z>>key = y=>key; 2=>p = y=>þp7 } 

// 4. stergerea propriu-zisa 

y->st y->dr 0; 

delete y; 


return 1; 


Complexitatea funcţ 
structuri tind să dev 


iei de ştergere este tipică pentru structurile de căutare. Aceste 
ină atât de compacte în organizarea lor internă, încât ştergerea 


fiecărei chei necesită reparaţii destul de complicate. De aceea, deseori se preferă 


o “ştergere leneşă” 
ştergerea efectivă re 


Deşi clasa arbore< 


(lazy deletion), prin care vârful este doar marcat ca “şters”, 
alizându-se cu ocazia unor reorganizări periodice. 


E> este incomplet specificată, lipsind constructorul de copiere, 


operatorul de atribuire, destructorul etc, operaţiile implementate în această 
secţiune pot fi testate prin următorul program. 


tinclude <iostream.h> 
tinclude "arbore.h" 
main( ) { 
int n; 
cout << "Numarul de varfuri T: Gin 2>- 0y 
arbore<char> 9; char c; float f} 
cout << "Cheile si Frecventele lor:\n"; 
tor ( ant i = Qi i < mp dit) { 
COUE <S Taea T3 


Gin >> Gi 
ğins{ cy 


} 


Lă 
cin >> f>? 
f )} 
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cout << “Arborele initial: n”; ginora 33 
cout << “ininDelete din initial (cheie) <EOF>:\n s243 
while cin >> ce) {í 
i£ | gedeel e i 4 
cout << "\nSe sterge varful cu cheia: " << c}; 


cout << "inlnordine: int; g.inorăț j; 


) 


else 
cout << "\nelement absent"; 
coub <4. Pup, Pa 


) 


cin.clear( ); 


g.re_greedy( ); 
cout << "IninArborele Greedy: n"; g.inord( ); 


cout << "IninInsert in Greedy " 
<< "(cheie+frecventa) <EOF>:\n... 1; 
while (cin >> c) && (cin >> f) ) 4 
inst c f )} 
cout << "inlnotdine: in"; g.inoedi ); 
gone <2. imisa "9 
) 


cin.clear( ); 


cout << "IninCautari in Greedy (cheie) <EOF>:n ..."; 
while| cin >> e) { 
if | g.searehi e ) | 
cout << "\nNodul cu cheia: T <€ 6 


cout << "inilnordine: n"; g.inorădț j; 


} 


else 
cout << "\nelement absent"; 
coub <4. yiia "3 


) 


cin.clear( ); 


cout << "IninDelete din Greedy (cheie) <EOF>: n ..."; 
whilei| cin >> e ) {í 
if | g.del( e) ) 4 
cout << "\nSe sterge varful cu cheia: " << c}; 


cout << "inilnordine: in"; g.inorăt j; 


) 


else 
cout << "nelement absent"; 
COUE 44. Puia PA 


) 


cin.clear( ); 
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g.re_prodin( ); 
cout << "Arborele Greedy re-ProgDin: n"; g.inord( ); 


return 1; 


) 


Funcţia arbore<E>::inord(), definită în Secţiunea 9.2, realizează afişarea 
arborelui, astfel încât să poată fi uşor de reconstituit pe hârtie. De exemplu, 
arborele din Figura 8.8b este afişat astfel: 


0xl66e | key C; £ 0, st 00000, dr 0x0000, tata O0x1l63e ) 
0z163e { key H; £ 0, st Oxlebc, dr Oxl65c, tata O0xz0000 ) 
0x169¢ | key M; £ 0, st 0x0000, dr 0x0000, tata Oxl68e ) 
0xl68e | key N, £ 0, st Uxl69c, dr Oxl6ac, tata 0xl65ce ) 
Oxl6ac ( key P, £ 0, st 0x0000, dr 0x0000, tata 0xl68c) 
0xl65e | key R, E 0, st Uxlcec, dr 0x0000, tata 0xl63c ) 


8.8 Programarea dinamică comparată cu tehnica 
greedy 


Atât programarea dinamică, cât şi tehnica greedy, pot fi folosite atunci când 
soluţia unei probleme este privită ca rezultatul unei secvenţe de decizii. Deoarece 
principiul optimalității poate fi exploatat de ambele metode, s-ar putea să fim 
tentaţi să elaborăm o soluţie prin programare dinamică, acolo unde este suficientă 
o soluţie greedy, sau să aplicăm în mod eronat o metodă greedy, atunci când este 
necesară de fapt aplicarea programării dinamice. Vom considera ca exemplu o 
problemă clasică de optimizare. 


Un hoţ pătrunde într-un magazin şi găseşte n obiecte, un obiect i având valoarea v, 
Şi greutatea g;. Cum să-și optimizeze hoţul profitul, dacă poate transporta cu un 


rucsac cel mult o greutate G? Deosebim două cazuri. În primul dintre ele, pentru 
orice obiect i, se poate lua orice fracțiune 0 < x; < 1 din el, iar în al doilea caz, 


x; e {0,1}, adică orice obiect poate fi încărcat numai în întregime în rucsac. 


Corespunzător acestor două cazuri, obţinem problema continuă a rucsacului, 
respectiv, problema 0/1 a rucsacului. Evident, hoţul va selecta obiectele astfel 
încât să maximizeze funcția obiectiv 


f(O0 = £ v;X; 
i=1 


unde x = (x, X3, -.-, X„), verifică condiția 
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n 
>J gix SG 
i=1 


Soluția problemei rucsacului poate fi privită ca rezultatul unei secvențe de decizii. 
De exemplu, hoțul va decide pentru început asupra valorii lui x,, apoi asupra 


valorii lui x, etc. Printr-o secvență optimă de decizii, el va încerca să maximizeze 


funcția obiectiv. Se observă că este valabil principiul optimalității. Ordinea 
deciziilor poate fi desigur oricare alta. 


Problema continuă a rucsacului se poate rezolva prin metoda greedy, selectând la 
fiecare pas, pe cât posibil în întregime, obiectul pentru care v,//g; este maxim. Fără 


a restrânge generalitatea, vom presupune că 
Vili È Val8a > ... > vl8n 


Puteţi demonstra că prin acest algoritm obţinem soluţia optimă şi că aceasta este 
de forma x = (RE žo 0, ...,0), k fiind un indice, 1 <k< n, astfel încât 
0< x, < 1. Algoritmul greedy găseşte secvența optimă de decizii, luând la fiecare 


pas câte o decizie care este optimă local. Algoritmul este corect, deoarece nici o 
decizie din secvență nu este eronată. Dacă nu considerăm timpul necesar sortării 
inițiale a obiectelor, timpul este în ordinul lui n. 


Să trecem la problema 0/1 a rucsacului. Se observă imediat că tehnica greedy nu 
conduce în general la rezultatul dorit. De exemplu, pentru g= (1, 2, 3), 
v = (6, 10, 12), G = 5, algoritmul greedy furnizează soluția (1, 1, 0), în timp ce 
soluția optimă este (0, 1, 1). Tehnica greedy nu poate fi aplicată, deoarece este 
generată o decizie (x, = 1) optimă local, nu însă şi global. Cu alte cuvinte, la 


primul pas, nu avem suficientă informație locală pentru a decide asupra valorii lui 
xı. Strategia greedy exploatează insuficient principiul optimalității, considerând 
că într-o secvență optimă de decizii fiecare decizie (şi nu fiecare subsecvență de 
decizii, cum procedează programarea dinamică) trebuie să fie optimă. Problema se 
poate rezolva printr-un algoritm de programare dinamică, în această situație 
exploatându-se complet principiul optimalității. Spre deosebire de problema 
continuă, nu se cunoaşte nici un algoritm polinomial pentru problema 0/1 a 
rucsacului. 


Diferența esenţială dintre tehnica greedy şi programarea dinamică constă în faptul 
că metoda greedy generează o singură secvență de decizii, exploatând incomplet 
principiul optimalității. În programarea dinamică, se generează mai multe 
subsecvențe de decizii; ținând cont de principiul optimalității, se consideră însă 
doar subsecvențele optime, combinându-se acestea în soluția optimă finală. Cu 
toate că numărul total de secvențe de decizii este exponențial (dacă pentru fiecare 


din cele n decizii sunt d posibilități, atunci sunt posibile d” secvențe de decizii), 
algoritmii de programare dinamică sunt de multe ori polinomiali, această reducere 
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a complexității datorându-se utilizării principiului optimalității. O altă 
caracteristică importantă a programării dinamice este că se memorează 
subsecvenţele optime, evitându-se astfel recalcularea lor. 


8.9 Exerciţii 


8.1 Demonstraţi că numărul total de apeluri recursive necesare pentru a-l 


n 
calcula pe C(n, k) este 2 = 2, 
k 


Soluţie: Notăm cu r(n, k) numărul de apeluri recursive necesare pentru a-l calcula 
pe C(n, k). Procedăm prin inducţie, în funcție de n. Dacă n este 0, proprietatea 
este adevărată. Presupunem proprietatea adevărată pentru n-l şi demonstrăm 
pentru n. 


Presupunem, pentru început, că 0 < k < n. Atunci, avem recurența 
r(n, k) = r(n—1, k—-1) + r(n-—l, k)+ 2 


Din relaţia precedentă, obținem 


n-—l n-—l n 
r(n, k) =2 —2+2 —2+2=2 — 2 
k-1 k k 
n 
Dacă k este O sau n, atunci r(n, k)=0 şi, deoarece în acest caz avem = 1, 


rezultă că proprietatea este adevărată. Acest rezultat poate fi verificat practic, 
rulând programul din Exerciţiul 2.5. 


8.2 Arătaţi că principiul optimalității 
i) este valabil în problema găsirii celui mai scurt drum dintre două vârfuri ale 
unui graf 


ii) nu este valabil în problema determinării celui mai lung drum simplu dintre 
două vârfuri ale unui graf 


2n 
8.3 Demonstraţi că > 4"10n+1). 
k 


8.4 Folosind algoritmul serie, calculați probabilitatea ca jucătorul A să 
câştige, presupunând n = 4 şi p = 0,45. 
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8.5 Problema înmulţirii înlănțuite optime a matricilor se poate rezolva şi prin 
următorul algoritm recursiv: 


function rminscalți, j) 
{returnează numărul minim de înmulţiri scalare 
pentru a calcula produsul matricial M, M,;,, ... M, 
if i = j then return 0 
q &— +% 
for k & i to j—l1 do 
q — min(g, rminscal(i, kh+rminscal(k+1, j)+d[i—l]d[k]d| j]) 
return q 


unde tabloul d[0 .. n] este global. Găsiți o limită inferioară a timpului. Explicați 
ineficiența acestui algoritm. 


Soluţie: Notăm cu r(j-i+1) numărul de apeluri recursive necesare pentru a-l 
calcula pe rminscal(i, j). Pentru n > 2 avem 


n-l 


n-—l 
r(n => r(k)+r(n-k) = 25 r(k) 2 2r(n-1) 
k=1 k=1 


iar r(2) = 2. Prin metoda iterației, deduceți că r(n) > o a pentru n > 2. Timpul 


pentru un apel rminscal(1, n) este atunci în Q(2”). 


8.6 Elaboraţi un algoritm eficient care să afişeze parantezarea optimă a unui 
produs matricial M(1), ..., M(n). Folosiţi pentru aceasta matricea r, calculată de 
algoritmul minscal. Analizaţi algoritmul obţinut. 


Soluţie: Se apelează cu paran(1, n) următorul algoritm: 


function paran(i, j) 
if i=j then write M(,i, “9” 

else write “(” 
parant(i, rli, j]) 
write “*” 
parantirli, j]+1, j) 
write “)” 

Arătați prin inducție că o parantezare completă unei expresii de n elemente are 

exact n—l perechi de paranteze. Deduceţi de aici care este eficiența algoritmului. 


8.7 Presupunând matricea P din algoritmul lui Floyd cunoscută, elaborați un 
algoritm care să afişeze prin ce vârfuri trece cel mai scurt drum dintre două 
vârfuri oarecare. 
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8.8 Într-un graf orientat, să presupunem că ne interesează doar existenţa, nu și 
lungimea drumurilor, între fiecare pereche de vârfuri. Iniţial, L[i, j] = true dacă 
muchia (i, j) există şi L[i, j] = false în caz contrar. Modificaţi algoritmul lui Floyd 
astfel încât, în final, să avem D[i, j] = true dacă există cel puţin un drum de la i la 
j şi DLi, j] = false în caz contrar. 


Soluţie: Se înlocuiește bucla cea mai interioară cu: 
Dli, j] — D[i, j] or (DLi, k] and DIk, j]) 


obținându-se algoritmul lui Warshall (1962). Matricea booleană L se numeşte 
închiderea tranzitivă a gratului. 


8.9 Arătaţi cu ajutorul unui contraexemplu că următoarea propoziţie nu este, 
în general, adevărată: “Un arbore binar este un arbore de căutare dacă cheia 
fiecărui vârf neterminal este mai mare sau egală cu cheia fiului său stâng şi mai 
mică sau egală cu cheia fiului său drept”. 


8.10 Fie un arbore binar de căutare reprezentat prin adrese, astfel încât vârful i 
(adică vârful a cărui adresă este i) este memorat în patru locaţii diferite conţinând 


KEY|i] = cheia vârfului 
ST[i] = adresa fiului stâng 
DR[i] = adresa fiului drept 
TATA|i] = adresa tatălui 


(Dacă se foloseşte o implementare prin tablouri paralele, atunci adresele sunt 
indici de tablou). Presupunem că variabila root conţine adresa rădăcinii arborelui 
şi că o adresă este zero, dacă şi numai dacă vârful către care se face trimiterea 
lipseşte. Elaboraţi algoritmi pentru următoarele operaţii în arborele de căutare: 


i) Determinarea vârfului care conţine o cheie v dată. Dacă un astfel de vârf nu 
există, se va returna adresa zero. 


ii) Determinarea vârfului care conţine cheia minimă. 


iii) Determinarea succesorului unui vârf i dat (succesorul vârfului i este vârful 
care are cea mai mică cheie mai mare decât KEY[i]). 


Care este eficienţa acestor algoritmi? 
Soluţie: 


i)  Apelăm tree-search(root, v), tree-search fiind funcția: 
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function tree-search(i, v) 
if i = 0 or v = KEY[i] then return i 
if v < KEY[i] then return rree-search(ST[i], v) 
else return free-search(DR[i], v) 


Iată şi o versiune iterativă a acestui algoritm: 


function iter-tree-search(i, v) 
while i + 0 and v + KEY[i] do 
if i < KEY[i]then i< ST[i] 
else i< DR[i] 
return i 
ii) Se apelează tree-min(root), tree-min fiind funcția: 
function tree-min(i) 
while ST[i] + 0 do i + ST[i] 
return i 
iii) Următorul algoritm returnează succesorul vârfului i: 


function tree-succesor(i) 
if DR[i] + O then return tree-min(DR[i]) 


j<- TATA|i] 
while j + O and i = DR[ j] do iej 

j — TATAL j] 
return j 


8.11 Găsiţi o formulă explicită pentru T(n), unde T(n) este numărul de arbori 
de căutare diferiți care se pot construi cu n chei distincte. 


Indicaţie: Faceţi legătura cu problema înmulţirii înlănțuite a matricilor. 


8.12 Există un algoritm greedy evident pentru a construi arborele optim de 
căutare având cheile c} < c, < ... < c: se plasează cheia cea mai probabilă, c,, la 


rădăcină şi se construiesc subarborii săi stâng şi drept pentru cheile 
Cis Cos -+> Cg q> TESpectiV, Cp Cko -> Cpo În mod recursiv, pe același principiu. 


i) Cât timp necesită algoritmul pentru cazul cel mai nefavorabil? 


ii)  Arătaţi pe baza unui contraexemplu că prin acest algoritm greedy nu se obţine 
întotdeauna arborele optim de căutare. 


8.13 Un subcaz oarecare al problemei 0/1 a rucsacului se poate formula astfel: 


Să se găsească 
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V(,j, X) = max pă V;Xi 


I<i<j 


unde maximul se ia pentru toţi vectorii (x, ..., x) pentru care 


$ gix < X 


I<i<j 
xe (0,1), I<is<j 


In particular, V(1, n, G) este valoarea maximă care se poate încărca în rucsac în 
cazul problemei inițiale. O soluţie a acestei probleme se poate obține dacă 
considerăm că deciziile se iau retrospectiv, adică în ordinea x,, Xp_p XI: 


Principiul optimalităţii este valabil şi avem 
VU, n, G) = max(V(, n-1, G), VU, n-1, G-8,) + v,) 
şi, în general, 
VU, j, X) = max( VU, j-1, X), VU, j-1, X-g;) + v,) 


unde V(1, 0, X) = 0 pentru X > 0, iar V(1, j, X) = —œ pentru X < 0. De aici se poate 
calcula, prin tehnica programării dinamice, valoarea V(l,n,G) care ne 
interesează. 


Găsiți o recurenţă similară pentru situația când deciziile se iau prospectiv, adică 


în ordinea x,, Xa, se., Xp 


8.14 Am văzut (în Secțiunea 6.1) că tehnica greedy poate fi aplicată în 
problema determinării restului cu un număr minim de monezi doar pentru anumite 
cazuri particulare. Problema se poate rezolva, în cazul general, prin metoda 
programării dinamice. 


Să presupunem că avem un număr finit de n tipuri de monezi, fiecare în număr 
nelimitat, iar tabloul M[1 .. n] conține valoarea acestor monezi. Fie § suma pe 
care dorim să o obținem, folosind un număr minim de monezi. 


i) În tabloul C[l ..n, 1.. S], fie C[i, j] numărul minim de monezi necesare 
pentru a obține suma j, folosind doar monezi de tipul M[1], M[2], ..., M[i], 
unde C[i, j] = +œ, dacă suma j nu poate fi obținută astfel. Găsiți o recurenţă 
pentru C[i, j]. 

ii) Elaborați un algoritm care foloseşte tehnica programării dinamice pentru a 
calcula valorile C[n, j], 1 <j < S. Algoritmul trebuie să utilizeze un singur 
vector de S elemente. Care este timpul necesar, în funcție de n şi S? 

iii) Găsiți un algoritm greedy care determină cum se obține suma § cu un număr 
minim de monezi, presupunând cunoscute valorile C[n, j]. 
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8.15 Fie u şi v două secvenţe de caractere. Dorim să transformăm pe u în v, cu 
un număr minim de operaţii de următoarele tipuri: 


e şterge un caracter 
e adaugă un caracter 


e schimbă un caracter 


De exemplu, putem să transformăm abbac în abcbc în trei etape: 


abbac — abac (şterge b) 
— ababc (adaugă b) 
— abcbc (schimbă a cu c) 


Arătaţi că această transformare nu este optimă. Elaboraţi un algoritm de 
programare dinamică care găseşte numărul minim de operaţii necesare (şi le 
specifică) pentru a-l transforma pe u în v. 


8.16 Să considerăm alfabetul > = (a, b, c}. Pentru elementele lui X definim 
următoarea tablă de înmulţire: 


simbolul drept 


simbolul a b b a 


stâng b|e b a 


Observați că înmulțirea definită astfel nu este nici comutativă şi nici asociativă. 
Găsiţi un algoritm eficient care examinează şirul x = x, x, ... x, de caractere ale 


lui £ şi decide dacă x poate fi parantezat astfel încât expresia rezultată să fie a. 
De exemplu, dacă x= bbbba, algoritmul trebuie să returneze “da” deoarece 
(b(bb))(ba) =a. 


8.17  Arătați că numărul de moduri în care un poligon convex cu n laturi poate 
fi partiționat în n—2 triunghiuri, folosind linii diagonale care nu se întretaie, este 
T(n—-1), unde T(n-—1) este al (n-1)-lea număr catalan. 


9. Explorări în grafuri 


Am văzut deja că o mare varietate de probleme se formulează în termeni de 
grafuri. Pentru a le rezolva, de multe ori trebuie să explorăm un graf, adică să 
consultăm (vizităm) vârfurile sau muchiile grafului respectiv. Uneori trebuie să 
consultăm toate vârfurile sau muchiile, alteori trebuie să consultăm doar o parte 
din ele. Am presupus, până acum, că există o anumită ordine a acestor consultări: 
cel mai apropiat vârf, cea mai scurtă muchie etc. În acest capitol, introducem 
câteva tehnici care pot fi folosite atunci când nu este specificată o anumită ordine 
a consultărilor. 


Vom folosi termenul de “graf” în două ipostaze. Un graf va fi uneori, ca şi până 
acum, o structură de date implementată în memoria calculatorului. Acest mod 
explicit de reprezentare nu este însă indicat atunci când graful conţine foarte 
multe vârfuri. 


Să presupunem, de exemplu, că folosim vârfurile unui graf pentru a reprezenta 
configurații în jocul de șah, fiecare muchie corespunzând unei mutări legale între 


J . i EE. 120. 4 . A > 

două configurații. Acest graf are aproximativ 10 “ vârfuri. Presupunând că un 
; E Tish . J s 

calculator ar fi capabil să genereze 10 - vârfuri pe secundă, generarea completă a 


grafului asociat jocului de şah s-ar face în mai mult de 10% ani! Un graf atât de 
mare nu poate să aibă decât o existență implicită, abstractă. 


Un graf implicit este un graf reprezentat printr-o descriere a vârfurilor şi 
muchiilor sale, el neexistând integral în memoria calculatorului. Porţiuni relevante 
ale grafului pot fi construite pe măsură ce explorarea progresează. De exemplu, 
putem avea în memorie doar o reprezentare a vârfului curent şi a muchiilor 
adiacente lui; pe măsură ce înaintăm în graf, vom actualiza această reprezentare. 


Tehnicile de explorare pentru cele două concepte de graf (grafuri construite 
explicit şi grafuri implicite) sunt, în esenţă, identice. Indiferent de obiectivul 
urmărit, explorarea se realizează pe baza unor algoritmi de parcurgere, care 
asigură consultarea sistematică a vârfurilor sau muchiilor grafului respectiv. 


9.1 Parcurgerea arborilor 


Pentru parcurgerea arborilor binari există trei tehnici de bază. Dacă pentru fiecare 
vârf din arbore vizităm prima dată vârful respectiv, apoi vârfurile din subarborele 
stâng şi, în final, subarborele drept, înseamnă că parcurgem arborele în preordine. 
Dacă vizităm subarborele stâng, vârful respectiv și apoi subarborele drept, atunci 
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parcurgem arborele în inordine, iar dacă vizităm prima dată subarborele stâng, 
apoi cel drept, apoi vârful respectiv, parcurgerea este în postordine. Toate aceste 
tehnici parcurg arborele de la stânga spre dreapta. Putem parcurge însă arborele și 
de la dreapta spre stânga, obținând astfel încă trei moduri de parcurgere. 


Proprietatea 9.1 Pentru fiecare din aceste şase tehnici de parcurgere, timpul 
necesar pentru a explora un arbore binar cu n vârfuri este în O(n). 


Demonstraţie: Fie t(n) timpul necesar pentru parcurgerea unui arbore binar cu n 
vârfuri. Putem presupune că există constanta reală pozitivă c, astfel încât t(n) < c 
pentru O0 <n < 1. Timpul necesar pentru parcurgerea unui arbore cu n vârfuri, 
n > 1, în care un vârf este rădăcina, i vârfuri sunt situate în subarborele stâng și 
n-—i-—l vârfuri în subarborele drept, este 


t(n) < c + max {t(i)+t(n-i-1) |0 <i < n-1} 


Vom arăta, prin inducție constructivă, că t(n) < dn+c, unde d este o altă constantă. 
Pentru n = 0, proprietatea este adevărată. Prin ipoteza inducției specificate parțial, 
presupunem că t(i) < di+c, pentru orice 0 < i < n. Demonstrăm că proprietatea este 
adevărată şi pentru n. Avem 


t(n) < c+2c+d(n—1) = dn+c+2c-d 


Luând d > 2c, obținem t(n) < dn+c. Deci, pentru d suficient de mare, t(n) < dn+c, 
pentru orice n > 0, adică re O(n). Pe de altă parte, re O(n), deoarece fiecare din 
cele n vârfuri trebuie vizitat. In consecință, te ©(n). m 


Pentru fiecare din aceste tehnici de parcurgere, implementarea recursivă necesită, 
în cazul cel mai nefavorabil, un spațiu de memorie în O(n) (demonstrați acest 
lucru!). Cu puţin efort, tehnicile menţionate pot fi implementate astfel încât să 
necesite un timp în O(n) şi un spaţiu de memorie în O(1), chiar dacă vârfurile nu 
conţin adresa tatălui (caz în care problema devine trivială). 


Conceptele de preordine şi postordine se pot generaliza pentru arbori arbitrari 
(nebinari). Timpul de parcurgere este tot în ordinul numărului de vârfuri. 


O astfel de implementare poate fi găsită, de exemplu, în E. Horowitz şi S. Sahni, “Fundamentals of 
Computer Algorithms”, Secţiunea 6.1.1. 
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9.2 Operatii de parcurgere în clasa arbore<E> 


Tipul abstract arbore este imposibil de conceput în lipsa unor metode sistematice 
de explorare. Iată câteva situaţii în care le-am folosit, sau va trebui să le folosim: 


e Reorganizarea într-un arbore de căutare optim. Este vorba de procedura 
setvarf () din clasa s8a (Secţiunea 8.7.1), procedură prin care s-a inițializat 
un tablou cu adresele tuturor vârfurilor din arbore. Acum este clar că am 
folosit o parcurgere în inordine, prilej cu care am ajuns şi la o procedură de 
sortare similară guicksort-ului. 

e Copierea, vârf cu vârf, a unui arbore într-un alt arbore. Procedura este 
necesară constructorului și operatorului de atribuire. 


e Implementarea destructorului clasei, adică eliberarea spaţiului ocupat de 
fiecare din vârfurile arborelui. 

e Afişarea unor “instantanee” ale structurii arborilor pentru a verifica 
corectitudinea diverselor operații. 


Operația de copiere este implementată prin funcţia _copy () din clasa varf<E>. 
Este vorba de o funcţie care copiază recursiv arborele al cărui vârf rădăcină este 
dat ca argument, iar apoi returnează adresa arborelui construit prin copiere. 


template <class E> 
yarf<E>* _copy| varf<E>* x ) { 


Varti<E> ta = Ü 

3r (XJ { 
// varful nou alocat se initializeaza cu x 
z = new varf<E>( x->key, x->p ); 


// se copiaza subarborii din stanga si din deapta; in 
// fiecare se initializeaza legatura spre varful tata 


if 4 (z>>8t = Copy X=>st )) l= 0) 
z->st->tata = £? 

if | (z>>de = _copyi( x->dr )) != Q J 
z=>Arootata = 2 


) 


return z; 


Invocarea acestei funcţii este realizată atât de către constructorul de copiere al 
clasei arbore, 
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template <class E> 
arbore<E>::arbore( const arbore<E>& a) { 
root = _copy( a.root ); n = a.n} 


) 


cât şi de către operatorul de atribuire: 


template <class E> 

arbore<E>& arbore<E>::operator =( const arbore<E>s a) | 
delete root; 
root = copy ( a.root ); n = a-n} 
return *this; 


Efectul instrucţiunii delete root ar trebui să fie ştergerea tuturor vârfurilor din 
arborele cu rădăcina root. Pentru a ajunge la acest rezultat, avem nevoie de 
implementarea corespunzătoare a destructorului clasei varf<E>, destructor 
invocat, după cum se ştie, înainte ca operatorul delete să elibereze spațiul alocat. 
Forma acestui destructor este foarte simplă: 


-varf ( ) { delete st; delete dr; } 


Efectul lui constă în ştergerea vârfurilor în postordine. Mai întâi, se acționează 
asupra sub-arborelui stâng, apoi asupra celui drept, iar în final, după execuţia 
corpului destructorului, operatorul delete eliberează spaţiul alocat vârfului 
curent. Condiţia de oprire a recursivităţii este asigurată de operatorul delete, el 
fiind inefectiv pentru adresele nule. În consecință, şi destructorul clasei 
arbore<E> constă într-un simplu delete root: 


-arbore( ) { delete root; ) 


Toate modalităţile de parcurgere menţionate în Secţiunea 9.1 pot fi implementate 
imediat, prin funcţiile corespunzătoare. Noi ne-am rezumat la implementarea 
parcurgerii în inordine deoarece, pe parcursul testării clasei arbore<E>, am avut 
nevoie de afişarea structurii arborelui. Funcţia 


template <class E> 
void _inordi varf<E> *x ) 4 


if ( 1! ) return; 


_inord( x->st Jj 
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<< ( key 1 << x->key 
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apelabilă din clasa arbore<E> prin 


template <class E> 
void. arbore<sE>:<inord( > | —inordi root )+ } 


este exact ceea ce ne trebuie pentru a afişa întreaga structură internă a arborelui. 


9.3 Parcurgerea grafurilor în adâncime 


Fie G = <V, M> un graf orientat sau neorientat, ale cărui vârfuri dorim să le 
consultăm. Presupunem că avem posibilitatea să marcăm vârfurile deja vizitate în 
tabloul global marca. Iniţial, nici un vârf nu este marcat. 


Pentru a efectua o parcurgere în adâncime, alegem un vârf oarecare, ve V, ca 
punct de plecare şi îl marcăm. Dacă există un vârf w adiacent lui v (adică, dacă 
există muchia (v, w) în graful orientat G, sau muchia {v, w} în graful neorientat 
G) care nu a fost vizitat, alegem vârful w ca noul punct de plecare şi apelăm 
recursiv procedura de parcurgere în adâncime. La întoarcerea din apelul recursiv, 
dacă există un alt vârf adiacent lui v care nu a fost vizitat, apelăm din nou 
procedura etc. Când toate vârfurile adiacente lui v au fost marcate, se încheie 
consultarea începută în v. Dacă au rămas vârfuri în V care nu au fost vizitate, 
alegem unul din aceste vârfuri şi apelăm procedura de parurgere. Continuăm 
astfel, până când toate vârfurile din V au fost marcate. lată algoritmul: 


procedure parcurge(G) 
for fiecare v e V do marcalv] + nevizitat 
for fiecare v e V do 
if marcalv] = nevizitat then ad(v) 


procedure ad(v) 
(vîrful v nu a fost vizitat) 
marcalv] — vizitat 
for fiecare vîrf w adiacent lui v do 
if marcalw] = nevizitat then ad(w) 
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(a) (b) 


Figura 9.1 Un graf neorientat şi unul din arborii săi parţiali. 


Acest mod de parcurgere se numeşte “în adâncime”, deoarece încearcă să inițieze 
cât mai multe apeluri recursive înainte de a se întoarce dintr-un apel. 


Parcurgerea în adâncime a fost formulată cu mult timp în urmă ca o tehnică de 
explorare a unui labirint. O persoană care caută ceva într-un labirint şi aplică 
această tehnică are avantajul că “următorul loc în care caută” este mereu foarte 
aproape. 


Pentru graful din Figura 9.la, presupunând că pornim din vârful 1 şi că vizităm 
vecinii unui vârf în ordine numerică, parcurgerea vârfurilor în adâncime se face în 
ordinea: 1, 2, 3,6,5,4,7,8. 


Desigur, parcurgerea în adâncime a unui graf nu este unică; ea depinde atât de 
alegerea vârfului iniţial, cât şi de ordinea de vizitare a vârfurilor adiacente. 


Cât timp este necesar pentru a parcurge un graf cu n vârfuri şi m muchii? 
Deoarece fiecare vârf este vizitat exact o dată, avem n apeluri ale procedurii ad. 
În procedura ad, când vizităm un vârf, testăm marcajul fiecărui vecin al său. Dacă 
reprezentăm graful prin liste de adiacenţă, adică prin ataşarea la fiecare vârf a 
listei de vârfuri adiacente lui, atunci numărul total al acestor testări este: m, dacă 
graful este orientat, şi 2m, dacă graful este neorientat. Algoritmul necesită un timp 
în O(n) pentru apelurile procedurii ad şi un timp în O(m) pentru inspectarea 
mărcilor. Timpul de execuţie este deci în O(max(m, n)) = O(m+n). 


Dacă reprezentăm graful printr-o matrice de adiacenţă, se obţine un timp de 
execuţie în O(n’). 


Parcurgerea în adâncime a unui graf G, neorientat şi conex, asociază lui G un 
arbore parțial. Muchiile arborelui corespund muchiilor parcurse în G, iar vârful 
ales ca punct de plecare devine rădăcina arborelui. Pentru graful din Figura 9.la, 
un astfel de arbore este reprezentat în Figura 9.lb prin muchiile “continue”; 
muchiile din G care nu corespund unor muchii ale arborelui sunt “punctate”. Dacă 
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graful G nu este conex, atunci parcurgerea în adâncime asociază lui G o pădure de 
arbori, câte unul pentru fiecare componentă conexă a lui G. 


Dacă dorim să şi marcăm numeric vârfurile în ordinea parcurgerii lor, adăugăm în 
procedura ad, la început: 


num <— num + 1 
preordlv] — num 


unde num este o variabilă globală iniţializată cu zero, iar preord[1 .. n] este un 
tablou care va conţine în final ordinea de parcurgere a vârfurilor. Pentru 
parcurgerea din exemplul precedent, acest tablou devine: 


RE 109 ARE 08 [RE E 208 SĂ (E (E 0 PE 3 


Cu alte cuvinte, se parcurg în preordine vârfurile arborelui parţial din Figura 9.1b. 


Se poate observa că parcurgerea în adâncime a unui arbore, pornind din rădăcină, 
are ca efect parcurgerea în preordine a arborelui. 


9.3.1 Puncte de articulare 


Parcurgerea în adâncime se dovedeşte utilă în numeroase probleme din teoria 
grafurilor, cum ar fi: detectarea componentelor conexe (respectiv, tare conexe) ale 
unui graf, sau verificarea faptului că un graf este aciclic. Ca exemplu, vom 
rezolva în această secţiune problema găsirii punctelor de articulare ale unui graf 
conex. 


Un vârf v al unui graf neorientat conex este un punct de articulare, dacă subgratul 
obţinut prin eliminarea lui v şi a muchiilor care plecă din v nu mai este conex. De 
exemplu, vârful 1 este un punct de articulare pentru graful din Figura 9.1. Un graf 
neorientat este biconex (sau nearticulat) dacă este conex şi nu are puncte de 
articulare. Grafurile biconexe au importante aplicaţii practice: dacă o reţea de 
telecomunicaţii poate fi reprezentată printr-un graf biconex, aceasta ne garantează 
că reţeaua continuă să funcţioneze chiar şi după ce echipamentul dintr-un vârf s-a 
defectat. 


Este foarte util să putem verifica eficient dacă un graf are puncte de articulare. 
Următorul algoritm găseşte punctele de articulare ale unui graf conex G. 


1. Efectuează o parcurgere în adâncime a lui G pornind dintr-un vârf oarecare. 
Fie A arborele parțial generat de această parcurgere şi preord tabloul care 
conţine ordinea de parcurgere a vârfurilor. 


2. Parcurge arborele A în postordine. Pentru fiecare vârf v vizitat, calculează 
minimlv] ca minimul dintre 
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e preordlv] 

e preordlw] pentru fiecare vârf w pentru care există o muchie {v, w} în G 
care nu are o muchie corespunzătoare în A (în Figura 9.lb, o muchie 
“punctată”) 


e minim[|x] pentru fiecare fiu x al lui v în A 
3. Punctele de articulare se determină acum astfel: 
a. rădăcina lui A este un punct de articulare al lui G, dacă şi numai dacă are 
mai mult de un fiu; 


b. un vârf v diferit de rădăcina lui A este un punct de articulare al lui G, 
dacă și numai dacă v are un fiu x, astfel încât minim[x] > preordlvl]. 


Pentru exemplul din Figura 9.1b, rezultă că tabloul minim este 


i sea zi ET 00 ij e = Jedi, 


iar vârfurile 1 şi 4 sunt puncte de articulare. 


Pentru a demonstra că algoritmul este corect, enunțăm pentru început o 
proprietate care rezultă din Exerciţiul 9.8: orice muchie din G, care nu are o 
muchie corespunzătoare în A, conecteză în mod necesar un vârf v cu un ascendent 
al său în A. Ținând cont de această proprietate, valoarea minimlv] se poate defini 
şi astfel: 


minimlv] = min(preordlw] | se poate ajunge din v în w urmând oricâte 
muchii “continue”, iar apoi urmând “în sus” 


cel mult o muchie “punctată”) 


Alternativa 3a din algoritm rezultă imediat, deoarece este evident că rădăcina lui 
A este un punct de articulare al lui G, dacă şi numai dacă are mai mult de un fiu. 


Să presupunem acum că v nu este rădăcina lui A. Dacă x este un fiu al lui v şi 
minimlx] < preordlv], rezultă că există o succesiune de muchii care îl conecteză 
pe x cu celelalte vârfuri ale grafului, chiar şi după eliminarea lui v. Pe de altă 
parte, nu există nici o succesiune de muchii care să îl conecteze pe x cu tatăl lui v, 
dacă minim[x] > preord[v]. Se deduce că şi alternativa 3b este corectă. 


9.3.2 Sortarea topologică 


In această secţiune, vom arăta cum putem aplica parcurgerea în adâncime a unui 
graf, într-un procedeu de sortare esenţial diferit faţă de sortările întâlnite până 
acum. 
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preparat bãut 
cafea ad cafea 
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trezire du°ul îmbrãcare plecare 


Figura 9.2 Un graf orientat aciclic. 


Să presupunem că reprezentăm diferitele stagii ale unui proiect complex printr-un 
graf orientat aciclic: vârfurile sunt stările posibile ale proiectului, iar muchiile 
corespund activităților care se cer efectuate pentru a trece de la o stare la alta. 
Figura 9.2 dă un exemplu al acestui mod de reprezentare. O sortare topologică a 
vârfurilor unui graf orientat aciclic este o operație de ordonare liniară a 
vârfurilor, astfel încât, dacă există o muchie (i, j), atunci i apare înaintea lui j în 
această ordonare. 


Pentru graful din Figura 9.2, o sortare topologică este A, B, C, E, D, F, iar o alta 
este A, B, E, C, D, F. In schimb, secvența A, B, C, D, E, F nu este în ordine 
topologică. 


Dacă adăugăm la sfîrşitul procedurii ad linia 
write v 


atunci procedura de parcurgere în adâncime va afişa vârfurile în ordine topologică 
inversă. Pentru a înțelege de ce se întîmplă acest lucru, să observăm că vârful v 
este afişat după ce toate vârfurile către care există o muchie din v au fost deja 
afişate. 


9.4 Parcurgerea grafurilor în lăţime 


Procedura de parcurgere în adâncime, atunci când se ajunge la un vârf v oarecare, 
explorează prima dată un vârf w adiacent lui v, apoi un vârf adiacent lui w etc. 
Pentru a efectua o parcurgere în lățime a unui graf (orientat sau neorientat), 
aplicăm următorul principiu: atunci când ajungem într-un vârf oarecare v 
nevizitat, îl marcăm şi vizităm apoi toate vârfurile nevizitate adiacente lui v, apoi 
toate vârfurile nevizitate adiacente vârfurilor adiacente lui v etc. Spre deosebire 
de parcurgerea în adâncime, parcurgerea în lăţime nu este în mod natural 
recursivă. 
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Pentru a putea compara aceste două tehnici de parcurgere, vom da pentru început 
o versiune nerecursivă pentru procedura ad. Versiunea se bazează pe utilizarea 
unei stive. Presupunem că avem funcţia ftop care returnează ultimul vârf inserat în 
stivă, fără să îl şteargă. Folosim şi funcțiile push şi pop din Secţiunea 3.1.1. 


procedure iterad(v) 
S < stivă vidă 
marcalv] — vizitat 
pushtv, S) 
while S nu este vidă do 
while există un vârf w adiacent lui ftop(S) 
astfel încât marcalw] = nevizitat do 
marcalw] — vizitat 
push(w, S) 
pop(S) 


Pentru parcurgerea în lățime, vom utiliza o coadă şi funcţiile inserr-queue, 
delete-queue din Secţiunea 3.1.2. Iată acum algoritmul de parcurgere în lățime: 


procedure /ar(v) 
C & coadă vidă 
marcalv] + vizitat 
insert-queue(v, C) 
while C nu este vidă do 
u + delete-queue(C) 
for fiecare vîrf w adiacent lui u do 
if marcalw] = nevizitat then marca[w] — vizitat 
insert-queue(w, C) 


Procedurile iterad şi lat trebuie apelate din procedura 


procedure parcurge(G) 
for fiecare v e V do marcalv] — nevizitat 
for fiecare v e V do 
if marca[v] = nevizitat then {iterad sau lat} (v) 


De exemplu, pentru graful din Figura 9.1, ordinea de parcurgere în lățime a 
vârfurilor este: 1, 2, 3, 4, 5, 6, 7, 8. 


Ca şi în cazul parcurgerii în adâncime, parcurgerea în lățime a unui graf G conex 
asociază lui G un arbore parțial. Dacă G nu este conex, atunci obținem o pădure 
de arbori, câte unul pentru fiecare componentă conexă. 


Analiza eficienței algoritmului de parcurgere în lățime se face la fel ca pentru 
parcurgerea în adâncime. Pentru a parcurge un graf cu n vârfuri şi m muchii 
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timpul este în: i) O(n+m), dacă reprezentăm graful prin liste de adiacenţă; ii) 
O(n’), dacă reprezentăm graful printr-o matrice de adiacență. 


Parcurgerea în lățime este folosită de obicei atunci când se explorează parțial 
anumite grafuri infinite, sau când se caută cel mai scurt drum dintre două vârfuri. 


9.5 Salvarea și restaurarea arborilor binari de căutare 


Importanţa operaţiilor de salvare (backup) şi restaurare (restore) este bine 
cunoscută de către toţi utilizatorii de calculatoare. Într-un fel sau altul, este bine 
ca informaţiile să fie arhivate periodic pe un suport extern, astfel ca, în caz de 
necesitate, să le putem reconstitui cât mai uşor. Pentru clasa arbore<E> am decis 
să implementăm operaţiile de salvare şi restaurare, în scopul de a facilita 
transferurile de arbori între programe. Vom exemplifica cu această ocazie, nu 
numai parcurgerea în lățime, ci şi lucrul cu fişiere binare, prin intermediul 
obiectelor de tip fstream din biblioteca standard de intrare/ieşire a limbajului 
C++, obiecte declarate în fişierul header <fstream.h>. 


Convenim să memorăm pe suportul extern atât cheia, cât şi probabilitatea 
(frecvenţa) de acces a fiecărui vârf. Scrierea se va face cheie după cheie (vârf 
după vârf), în ordinea obţinută printr-un proces de vizitare a arborelui. 
Restaurarea arborelui este realizată prin inserarea fiecărei chei într-un arbore 
inițial vid. Citirea cheilor este secvenţială, adică în ordinea în care au fost scrise 
în fişier. 


Parcurgerile în adâncime (în preordine) şi în lățime au proprietatea că vârful 
rădăcină al arborelui şi al fiecărui subarbore este vizitat (şi deci inserat) înaintea 
vârfurilor fii. Avem astfel garantată reconstituirea corectă a arborelui de căutare, 
deoarece în momentul în care se inserează o cheie oarecare, toate vârfurile 
ascendente sunt deja inserate. În cele ce urmează, vom utiliza parcurgerea în 
lăţime. 


Parcurgerea în lățime a arborilor binari se face conform algoritmului din 
Secţiunea 9.4, cu specificarea că, deoarece arborii sunt grafuri conexe şi aciclice, 
nu mai este necesară marcarea vârfurilor. In procedura de salvare, 
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template <class E> 
int arbore<E>::save( char *file ) { 


Capitolul 9 


ofstream f( file, ios::binary );  // deschide fisierul 
if (!£f ) return 0; // eroare la deschider 


coada<varf<t>*> c(n + 1); // ptr. parcurgerea in latime 


varf<E> *x; // vartul curent 
E, ina pi roct Îi // primul element din coada 
while ( c.del g(x} ) { 
if ( !f.write( (char *) &(x->key), sizeof( x->key ) ) ) 
return 0; // eroare la scriere 
if ( !f.write( (char *) &(x->p J; sizeof( x->p DE N 
return 0; // eroare la scriere 


if | x>=>st 7 cins | xi J} 
if | x=>de 3 c-ins gi xder J} 
) 
f. close{ J} 
return 1; 


vizitarea unui vârf constă în scrierea informaţiilor asociate în fişierul de ieşire. De 


această dată, nu vom mai folosi operatorii de ieşire >> ai claselor 


E şi float, ci 


vom copia, octet cu octet, imaginea binară a cheii şi a probabilității asociate. 
Cheia este situată la adresa &(x—>key) şi are lungimea sizeof (x->key), sau 


sizeof (E). Probabilitatea este situată la adresa &(x->p) şi 


are lungimea 


sizeof (x—>p), sau sizeof (float). Operația de scriere necesită un obiect de tip 
ofstream, output file stream, creat pe baza numelui fişierului char *file. Prin 
valoarea ios: :binary din lista de argumente a constructorului clasei ofstream, 
fişierul va fi deschis în modul binar de lucru și nu în modul implicit text. 


Funcţia de restaurare 
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template <class E> 


int arbore<E>::rest( char *file ) | 
ifstream f( file, ios::binary ); // deschide fisierul 
if { LE ) return 0; // eroare la deschidere 


delete root; 
root = 0; n = 0; // se va crea un nou arbore 
E key; float p; // informatia din varful curent 
while ( f.read( (char *) &key, sizeof( key ) ) && 
f.read( (char *) &p, sizeof( p J J ) 
ins{ key, p Jj 


f.close( ); 
return 1; 


constă în deschiderea fişierului binar cu numele dat de parametrul char *file 
prin intermediul unui obiect de tip ifstream, input file stream, citirea celor două 
componente ale fiecărui vârf (cheia key şi frecvența p) şi inserarea vârfului 
corespunzător în arbore. Neavând certitudinea că iniţial arborele este vid, funcţia 
de restaurare şterge toate vârfurile arborelui înainte de a începe inserarea cheilor 
citite din fişier. 


Testarea corectitudinii operaţiilor din clasele ifstreanm şi ofstream se realizează 
prin invocarea implicită a operatorului de conversie la int. Acest operator 
returnează false, dacă starea stream-lui corespunde unei erori, sau true, în caz 
contrar. Invocarea lui este implicită, deoarece funcţiile membre ifstream: : read 
şi ofstream: :write returnează obiectul invocator, iar sintaxa instrucţiunii while 
solicită o expresie de tip întreg. Acest operator de conversie la int este moştenit 
de la clasa ios, input-output stream, clasă din care sunt derivate toate celelalte 
clase utilizate pentru operaţiile de intrare/ieşire. 


9.6  Backtracking 


Backtracking (în traducere aproximativă, “căutare cu revenire”) este un principiu 
fundamental de elaborare a algoritmilor pentru probleme de optimizare, sau de 
găsire a unor soluţii care îndeplinesc anumite condiţii. Algoritmii de tip 
backtracking se bazează pe o tehnică specială de explorare a grafurilor orientate 
implicite. Aceste grafuri sunt de obicei arbori, sau, cel puţin, nu conţin cicluri. 


Pentru exemplificare, vom considera o problemă clasică: cea a plasării a opt 
regine pe tabla de şah, astfel încât nici una să nu intre în zona controlată de o alta. 
O metodă simplistă de rezolvare este de a încerca sistematic toate combinaţiile 
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posibile de plasare a celor opt regine, verificând de fiecare dată dacă nu s-a 
obţinut o soluţie. Deoarece în total există 


64 
| A) = 4426.165.368 


combinaţii posibile, este evident că acest mod de abordare nu este practic. O 
primă îmbunătăţire ar fi să nu plasăm niciodată mai mult de o regină pe o linie. 
Această restricție reduce reprezentarea pe calculator a unei configurații pe tabla 
de şah la un simplu vector, posibil[l .. 8]: regina de pe linia i, 1 < i < 8, se află pe 
coloana posibil[i], adică în poziţia (i, posibil[i]). De exemplu, vectorul 
(3, 1, 6, 2, 8, 6,4, 7) nu reprezintă o soluţie, deoarece reginele de pe liniile trei şi 
şase sunt pe aceeaşi coloană şi, de asemenea, există două perechi de regine situate 
pe aceeaşi diagonală. Folosind acestă reprezentare, putem scrie în mod direct 
algoritmul care găseşte o soluţie a problemei: 


procedure reginel 
for i, — 1 to 8 do 


for i, — 1 to 8 do 


for i; — 1 to 8 do 
posibil — (ij, îns ..., în) 
if soluție(posibil) then write posibil 
stop 
write “nu există soluţie” 


De această dată, numărul combinațiilor este redus la 8% = 16.777.216, algoritmul 
oprindu-se de fapt după ce inspectează 1.299.852 combinaţii şi găseşte prima 
soluţie. 


Vom proceda acum la o nouă îmbunătăţire. Dacă introducem şi restricția ca două 
regine să nu se afle pe aceeași coloană, o configuraţie pe tabla de șah se poate 
reprezenta ca o permutare a primilor opt întregi. Algoritmul devine 


procedure regine? 
posibil < permutarea iniţială 
while posibil + permutarea finală and not soluție(posibil) do 
posibil <— următoarea permutare 
if soluție(posibil) then write posibil 
else write “nu există soluție” 


Sunt mai multe posibilități de a genera sistematic toate permutările primilor n 
întregi. De exemplu, putem pune fiecare din cele n elemente, pe rând, în prima 
poziţie, generând de fiecare dată recursiv toate permutările celor n-—l elemente 
rămase: 
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procedure perm(i) 
ifi=n then utilizează(T) {T este o nouă permutare} 
else for j< i ton do interschimbă T[i] și T[ j] 
perm(i+|) 
interschimbă T[i] și T[ j] 


În algoritmul de generare a permutărilor, T[1 .. n] este un tablou global inițializat 
cu [1, 2, ..., n], iar primul apel al procedurii este perm(1). Dacă utilizează(T) 
necesită un timp constant, atunci perm(1) necesită un timp în O(n!). 


Această abordare reduce numărul de configurații posibile la 8! = 40.320. Dacă se 
foloseşte algoritmul perm, atunci până la prima soluție sunt generate 2830 
permutări. Mecanismul de generare a permutărilor este mai complicat decât cel de 
generare a vectorilor de opt întregi între 1 şi 8. În schimb, verificarea faptului 
dacă o configurație este soluţie se face mai uşor: trebuie doar verificat dacă nu 
există două regine pe aceeași diagonală. 


Chiar şi cu aceste îmbunătățiri, nu am reuşit încă să eliminăm o deficiență comună 
a algoritmilor de mai sus: verificarea unei configurații prin “if soluție(posibil)” se 
face doar după ce toate reginele au fost deja plasate pe tablă. Este clar că se 
pierde astfel foarte mult timp. 


Vom reuși să eliminăm această deficiență aplicând principiul backtracking. Pentru 
început, reformulăm problema celor opt regine ca o problemă de căutare într-un 
arbore. Spunem că vectorul P[I .. k] de întregi între 1 şi 8 este k-promițător, 
pentru 0<k<8, dacă zonele controlate de cele k regine plasate în poziţiile 
(1, P[1]), (2, P[2]), ..., (k, P[k]) sunt disjuncte. Matematic, un vector P este 
k-promiţător dacă: 


P[i] — PLjl e [i —]j,0,j —i), pentru orice 0< i, j<k,i+j 


Pentru k < 1, orice vector P este k-promiţător. Soluţiile problemei celor opt regine 
corespund vectorilor 8-promițători. 


Fie V mulțimea vectorilor k-promiţători, 0<k< 8. Definim graful orientat 
G = <V, M> astfel: (P, 0) e M, dacă şi numai dacă există un întreg k, 0<k<8, 
astfel încât P este k-promițător, Q este (k+I)-promiţător şi P[i] = Oli] pentru 
fiecare 0<i < k. Acest graf este un arbore cu rădăcina în vectorul vid (k = 0). 
Vârfurile terminale sunt fie soluţii (k = 8), fie vârfuri “moarte” (k < 8), în care 
este imposibil de plasat o regină pe următoarea linie fără ca ea să nu intre în zona 
controlată de reginele deja plasate. Soluţiile problemei celor opt regine se pot 
obţine prin explorarea acestui arbore. Pentru aceasta, nu este necesar să generăm 
în mod explicit arborele: vârfurile vor fi generate și abandonate pe parcursul 
explorării. Vom parcurge arborele G în adâncime, ceea ce este echivalent aici cu o 
parcurgere în preordine, “coborând” în arbore numai dacă există şanse de a ajunge 
la o soluţie. 
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Acest mod de abordare are două avantaje faţă de algoritmul regine2. În primul 
rând, numărul de vârfuri în arbore este mai mic decât 8!. Deoarece este dificil să 
calculăm teoretic acest număr, putem număra efectiv vârfurile cu ajutorul 
calculatorului: #V = 2057. De fapt, este suficient să explorăm 114 vârfuri pentru a 
ajunge la prima soluţie. În al doilea rând, pentru a decide dacă un vector este 
(k+1)-promiţător, cunoscând că este extensia unui vector k-promiţător, trebuie 
doar să verificăm ca ultima regină adăugată să nu fie pusă într-o poziţie controlată 
de reginele deja plasate. Ca să apreciem cât am câştigat prin acest mod de 
verificare, să observăm că în algoritmul regine2, pentru a decide dacă o anumită 
permutare este o soluţie, trebuia să verificăm fiecare din cele 28 de perechi de 
regine de pe tablă. 


Am ajuns, în fine, la un algoritm performant, care afişează toate soluţiile 
problemei celor opt regine. Din programul principal, apelăm regine(0), 
presupunând că posibil[ 1 .. 8] este un tablou global. 


procedure regine(k) 
(posibill 1 .. k] este k-promiţător) 
ifk=8 then write posibil {este o soluţie) 
else {explorează extensiile (k+1)-promițţătoare 
ale lui posibil) 
for j — 1 to 8 do 
if plasare(k, j) then posibillk+1] — j 
regine(k+1) 


function plasare(k, j) 
{returnează true, dacă şi numai dacă se 
poate plasa o regină în poziția (k+1, j)} 
for i — 1 to k do 
if j-posibilli] e {k+1—i, 0, i—k—1 } then return false 
return true 


Problema se poate generaliza, astfel încât să plasăm n regine pe o tablă de n linii 
şi n coloane. Cu ajutorul unor contraexemple, puteţi arăta că problema celor n 
regine nu are în mod necesar o soluție. Mai exact, pentru n < 3 nu există soluţie, 
iar pentru n > 4 există cel puţin o soluţie. 


Pentru valori mai mari ale lui n, avantajul metodei backtracking este, după cum ne 
şi aşteptăm, mai evident. Astfel, în problema celor douăsprezece regine, 
algoritmul regine? consideră 479.001.600 permutări posibile şi găseşte prima 
soluție la a 4.546.044 configuraţie examinată. Arborele explorat prin algoritmul 
regine conţine doar 856.189 vârfuri, prima soluţie obținându-se deja la vizitarea 
celui de-al 262-lea vârf. 
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Algoritmii backtracking pot fi folosiți şi atunci când soluţiile nu au în mod 
necesar aceeași lungime. Presupunând că nici o soluţie nu poate fi prefixul unei 
alte soluţii, iată schema generală a unui algoritm backtracking: 


procedure backtrack(v[1 .. k]) 
{v este un vector k-promiţător) 
if v este o soluţie 
then write v 
else for fiecare vector w care este (k+1)-promiţător, 
astfel încât w[1 .. k] =v[1 .. k] 
do backtrack(w[1 .. k+1]) 


Există foarte multe aplicații ale algoritmilor backtracking. Puteți încerca astfel 
rezolvarea unor probleme întîlnite în capitolele anterioare: problema colorării 
unui graf, problema 0/1 a rucsacului, problema monezilor (cazul general). Tot 
prin backtracking puteți rezolva şi o variantă a problemei comis-voiajorului, în 
care admitem că există oraşe fără legătură directă între ele şi nu se cere ca ciclul 
să fie optim. 


Parcurgerea în adâncime, folosită în algoritmul regine, devine şi mai avantajoasă 
atunci când ne mulțumim cu o singură soluție a problemei. Sunt însă şi probleme 
pentru care acest mod de explorare nu este avantajos. 


Anumite probleme pot fi formulate sub forma explorării unui graf implicit care 
este infinit. În aceste cazuri, putem ajunge în situația de a explora fără sfârşit o 
anumită ramură infinită. De exemplu, în cazul cubului lui Rubik, explorarea 
manipulărilor necesare pentru a trece dintr-o configuraţie într-alta poate cicla la 
infinit. Pentru a evita asemenea situații, putem utiliza explorarea în lățime a 
grafului. În cazul cubului lui Rubik, mai avem astfel un avantaj: obţinem în primul 
rând soluţiile care necesită cel mai mic număr de manipulări. Această idee este 
ilustrată de Exerciţiul 9.15. 


Am văzut că algoritmii backtracking pot folosi atât explorarea în adâncime cât și 
în lăţime. Ceea ce este specific tehnicii de explorare backtracking este testul de 
fezabilitate, conform căruia, explorarea anumitor vârfuri poate fi abandonată. 


9.7  Grafuri și jocuri 


Cele mai multe jocuri strategice pot fi reprezentate sub forma grafurilor orientate 
în care vârfurile sunt poziții în joc, iar muchiile sunt mutări legale între două 
poziţii. Dacă numărul poziţiilor nu este limitat a priori, atunci graful este infinit. 
Vom considera în cele ce urmează doar jocuri cu doi parteneri, fiecare având pe 
rând dreptul la o mutare. Presupunem, de asemenea, că jocurile sunt simetrice 
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(regulile sunt aceleaşi pentru cei doi parteneri) și deterministe (nu există un factor 
aleator). 


Pentru a determina o strategie de câştig într-un astfel de joc, vom atașa fiecărui 
vârf al grafului o etichetă care poate fi de câștig, pierdere, sau remiză. Eticheta 
corespunde situaţiei unui jucător care se află în poziţia respectivă şi trebuie să 
mute. Presupunem că nici unul din jucători nu greşeşte, fiecare alegând mereu 
mutarea care este pentru el optimă. În particular, din anumite poziţii ale jocului 
nu se poate efectua nici o mutare, astfel de poziţii terminale neavând poziţii 
succesoare în graf. Etichetele vor fi ataşate în mod sistematic astfel: 


e Etichetele atașate unei poziţii terminale depind de jocul în cauză. De obicei, 
jucătorul care se află într-o poziţie terminală a pierdut. 

e O poziţie neterminală este o poziţie de câştig, dacă cel puţin una din poziţiile 
ei succesoare în graf este o poziţie de pierdere. 

e O poziție neterminală este o poziție de pierdere, dacă toate poziţiile ei 
succesoare în graf sunt poziţii de câștig. 

e Orice poziţie care a rămas neetichetată este o poziție de remiză. 


Dacă jocul este reprezentat printr-un graf finit aciclic, această metodă etichetează 
vârfurile în ordine topologică inversă. 


9.7.1 Jocul nim 


Vom ilustra aceste idei printr-o variantă a jocului nim. Inițial, pe masă se află cel 
puţin două bețe de chibrit. Primul jucător ridică cel puțin un băț, lăsând pe masă 
cel puțin un băț. În continuare, pe rând, fiecare jucător ridică cel puțin un băț şi 
cel mult de două ori numărul de bețe ridicate de către partenerul de joc la mutarea 
anterioară. Câştigă jucătorul care ridică ultimul băț. Nu există remize. 


O poziţie în acest joc este specificată atât de numărul de bețe de pe tablă, cât şi de 
numărul maxim de bețe care pot fi ridicate la următoarea mutare. Vârfurile 
grafului asociat jocului sunt perechi <i, j>, 1 <j < i, indicând că pot fi ridicate cel 
mult j bețe din cele i bețe de pe masă. Din vârful <i, j> pleacă j muchii către 
vârfurile <i—k, min(2k, i—k)>, 1<k<]j. Vârful corespunzător poziţiei iniţiale 
într-un joc cu n bețe, n > 2, este <n,n-—l>. Toate vârfurile pentru care a două 
componentă este zero corespund unor poziţii terminale, dar numai vârful <0, 0> 
este interesant: vârfurile <i, 0>, pentru i > 0, sunt inaccesibile. În mod similar, 
vârfurile <i, j>, cu j impar şi j < i-l, sunt inaccesibile. Vârful <0, 0> corespunde 
unei poziţii de pierdere. 
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Figura 9.3 Graful unui joc. 


Figura 9.3 reprezintă graful corespunzător jocului cu cinci bețe inițiale: vârfurile 
albe corespund poziţiilor de câştig, vârfurile gri corespund poziţiilor de pierdere, 
muchiile “continue” corespund mutărilor prin care se câștigă, iar muchiile 
“punctate” corespund mutărilor prin care se pierde. Dintr-o poziţie de pierdere nu 
pleacă nici o muchie “continuă”, aceasta corespunzând faptului că din astfel de 
poziţii nu există nici o mutare prin care se poate câştiga. 


Se observă că jucătorul care are prima mutare într-un joc cu două, trei, sau cinci 
bețe nu are nici o strategie de câştig, dar are o astfel de strategie într-un joc cu 
patru bețe. 
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Următorul algoritm recursiv determină dacă o poziţie este de câştig. 


function reci, j) 
{returnează true dacă şi numai dacă vârful 
<i, j> reprezintă o poziţie de câștig; 
presupunem că 0<j<i) 
for k — 1 to ]j do 
if not rec(i—k, min(2k, i—k)) then return true 
return false 


Algoritmul are acelaşi defect ca şi algoritmul fibl (Capitolul 1): calculează în 
mod repetat anumite valori. De exemplu, rec(5, 4) returnează false după ce a 
apelat succesiv 


rec(4, 2), rec(3, 3), recQ, 2), rec(1, 1) 
Dar rec(3, 3) apelează, de asemenea, rec(2, 2) şi rec(1, 1). 


Putem evita acest lucru, construind prin programarea dinamică o matrice booleană 
globală, astfel încât G[i, j] = true, dacă şi numai dacă <i, j> este o poziţie de 
câştig. Fie n numărul maxim de bețe folosite. Ca de obicei în programarea 
dinamică, calculăm matricea G de jos în sus: 


procedure din(n) 

(calculează de jos în sus matricea G[1..n, 1..n]) 

G[0, 0] & false 

for i — 1 ton do 

for j — 1 to i do 

ke1 
while k < j and G[i—k, min(2k, i—k)] do k 4 k+1 
G[i, j] — not G[i—k, min(2k, i—k)] 


Prin tehnica programării dinamice, fiecare valoare a lui G este calculată o singură 
dată. Pe de altă parte însă, în acest context multe din valorile lui G sunt calculate 
în mod inutil. Astfel, este inutil să-l calculăm pe G[i, j] atunci când j este impar și 
j< i-l. Iată şi un alt exemplu de calcul inutil: ştim că <15, 14> este o poziție de 
câştig, imediat ce am aflat că al doilea succesor al său, <13, 4>, este o poziție de 
pierdere; valoarea lui G(12, 6) nu mai este utilă în acest caz. Nu există însă nici 
un raționament “de jos în sus” pentru a nu-l calcula pe G[12, 6]. Pentru a-l calcula 
pe G[15, 14], algoritmul din calculează 121 de valori G[i, j], însă utilizează 
efectiv doar 27 de valori. 


Algoritmul recursiv rec este ineficient, deoarece calculează anumite valori în mod 
repetat. Pe de altă parte, datorită raționamentului “de sus în jos”, nu calculează 
niciodată valori pe care să nu le şi utilizeze. 


Rezultă că avem nevoie de o metodă care să îmbine avantajele formulării 
recursive cu cele ale programării dinamice. Cel mai simplu este să adăugăm 
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algoritmului recursiv o funcție de memorie care să memoreze dacă un vârf a fost 
deja vizitat sau nu. Pentru aceasta, definim matricea booleană globală 
initlO .. n, O .. n], inițializată cu false. 


function nim(i, j) 
if inirli, j] then return G[i, j] 
init[i, j] — true 
for k — 1 to j do 
if not nim(i—k, min(2k, i—k)) then G[i, j] — true 
return true 
G[i, j] — false 
return false 


Deoarece matricea init trebuie inițializată, aparent nu am câștigat nimic față de 
algoritmul care foloseşte programarea dinamică. Avantajul obținut este însă mare, 
deoarece operația de inițializare se poate face foarte eficient, după cum vom 
vedea în Secțiunea 10.2. 


Când trebuie să soluționăm mai multe cazuri similare ale aceleiaşi probleme, 
merită uneori să calculăm câteva rezultate auxiliare care să poată fi apoi folosite 
pentru accelerarea soluționării fiecărui caz. Această tehnică se numește 
precondiționare şi este exemplificată în Exerciţiul 9.7. 


Jocul nim este suficient de simplu pentru a permite şi o rezolvare mai eficientă 
decât prin algoritmul nim, fără a folosi graful asociat. Algoritmul de mai jos 
determină strategia de câştig folosind precondiţionarea. Într-o poziţie iniţială cu n 
bețe, se apelează la început precond(n). Se poate arăta că un apel precond(n) 
necesită un timp în O(n). După aceea, orice apel mutare(i, j), 1 < j < i, returnează 
într-un timp în O(1) câte bețe să fie ridicate din poziţia <i, j>, pentru o mutare de 
câștig. Dacă poziţia <i,j> este de pierdere, în mod convenţional se indică 
ridicarea unui băț, ceea ce întîrzie pe cât posibil pierderea inevitabilă a jocului. 
Tabloul 7 [0 .. n] este global. 


procedure precond(n) 
T[0] e œ 
for i e 1 to n do 
ke1 
while 7[i—k] < 2k do k + k+1 
T[i] <+ k 


function mutare(i, j) 
if j < T[i] then return 1 {prelungeşte agonia!) 
return T[i] 


Nu vom demonstra aici corectitudinea acestui algoritm. 
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9.7.2  Şahul şi tehnica minimax 


Şahul este, desigur, un joc mult mai complex decât jocul nim. La prima vedere, 
graful asociat şahului conţine cicluri. Există însă reglementări ale Federaţiei 
Internaţionale de Şah care previn intrarea într-un ciclu. De exemplu, se declară 
remiză o partidă după 50 de mutări în care nu are loc nici o acţiune ireversibilă 
(mutarea unui pion, sau eliminarea unei piese). Datorită acestor reguli, putem 
considera că graful asociat șahului nu are cicluri. 


Vom eticheta fiecare vârf ca poziţie de câștig pentru Alb, poziţie de câștig pentru 
Negru, sau remiză. Odată construit, acest graf ne permite să jucăm perfect şah, 
adică să câştigăm mereu, când este posibil, şi să pierdem doar când este 
inevitabil. Din nefericire (din fericire pentru jucătorii de şah), acest graf conţine 
atâtea vârfuri, încât nu poate fi explorat complet nici cu cel mai puternic 
calculator existent. 


Deoarece o căutare completă în graful asociat jocului de şah este imposibilă, nu 
putem folosi tehnica programării dinamice. Se impune atunci, în mod natural, 
aplicarea unei tehnici recursive, care să modeleze raționamentul “de sus în jos”. 
Această tehnică (numită minimax) este de tip euristic, şi nu ne oferă certitudinea 
câștigării unei partide. Ideea de bază este următoarea: fiind într-o poziţie 
oarecare, se alege una din cele mai bune mutări posibile, explorând doar o parte a 
grafului. Este de fapt o modelare a raționamentului unui jucător uman care 
gândeşte doar cu un mic număr de mutări în avans. 


Primul pas este să definim o funcţie de evaluare statică eval, care atribuie o 
anumită valoare fiecărei poziţii posibile. În mod ideal, eval(u) va crește atunci 
când poziţia u devine mai favorabilă Albului. Această funcție trebuie să ţină cont 
de mai mulți factori: numărul şi calitatea pieselor existente de ambele părți, 
controlul centrului tablei, libertatea de mişcare etc. Trebuie să facem un 
compromis între acurateţea acestei funcții şi timpul necesar calculării ei. Când se 
aplică unei poziţii terminale, funcţia de evaluare trebuie să returneze +œ dacă a 
câştigat Albul, —co dacă a câştigat Negrul şi O dacă a fost remiză. 


Dacă funcţia de evaluare statică ar fi perfectă, ar fi foarte uşor să determinăm care 
este cea mai bună mutare dintr-o anumită poziţie. Să presupunem că este rândul 
Albului să mute din poziția u. Cea mai bună mutare este cea care îl duce în poziția 
v, pentru care 


eval(v) = max(eval(w) | w este succesor al lui u} 
Această poziţie se determină astfel: 


val e —oo 
for fiecare w succesor al lui u do 
if eval(w) > val then val — eval(w) 
vew 
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Complexitatea jocului de şah este însă atât de mare încât este imposibil să găsim o 
astfel de funcţie de evaluare perfectă. 


Presupunând că funcţia de evaluare nu este perfectă, o strategie bună pentru Alb 
este să prevadă că Negrul va replica cu o mutare care minimizează funcţia eval. 
Albul gândeşte astfel cu o mutare în avans, iar funcţia de evaluare este calculată 
în mod dinamic. 


val e —oo 
for fiecare w succesor al lui u do 
if w nu are succesor 
then valw — eval(w) 
else valw + min(eval(x) | x este succesor al lui w} 
if valw > val then val — valw 
vew 


Pentru a adăuga şi mai mult dinamism funcţiei eval, este preferabil să investigăm 
mai multe mutări în avans. Din poziţia u, analizând n mutări în avans, Albul va 
muta atunci în poziţia v dată de 


val e —oo 
for fiecare w succesor al lui u do 
if negru(w, n) > val then val — negru(w, n) 
vew 


Funcțiile negru şi alb sunt următoarele: 


function negru(w, n) 
if n = 0 or w nu are succesori 
then return eval(w) 
return mințalb(x, n—1) | x este succesor al lui w} 


function alb(x, n) 
if n = 0 or x nu are succesori 
then return eval(x) 
return max (negru(w, n-—l) | w este succesor al lui x) 


Acum înţelegem de ce această tehnică este numită minimax: Negrul încearcă să 
minimizeze avantajul pe care îl permite Albului, iar Albul încearcă să maximizeze 
avantajul pe care îl poate obţine la fiecare mutare. 


Tehnica minimax poate fi îmbunătăţită în mai multe feluri. Astfel, explorarea 
anumitor ramuri poate fi abandonată mai curând, dacă din informaţia pe care o 
deținem asupra lor, deducem că ele nu mai pot influenţa valoarea vârfurilor 
situate la un nivel superior. Acestă îmbunătăţire se numeşte retezare alfa-beta 
(alpha-beta pruning) şi este exemplificată în Figura 9.4. Presupunând că valorile 
numerice ataşate vârfurilor terminale sunt valorile funcţiei eval calculate în 
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cine mută: regula: 
Albul max 
Negrul S s min 
Albul i © T n i O max 
Negrul | e min 


Figura 9.4 Retezare alfa-beta. 


pozițiile respective, celelalte valori se pot calcula prin tehnica minimax, 
parcurgând arborele în postordine. Obținem succesiv eval(b) = 5, eval( f) = 6, 
eval(g) = 3. În acest moment știm deja că eval(c) < 3 şi, fără să-l mai calculăm pe 
eval(h), obţinem valoarea eval(a) = 5. Cu alte cuvinte, la o anumită fază a 
explorării am dedus că putem abandona explorarea subarborelui cu rădăcina în h 
(îl putem “reteza”). 


Tehnica minimax determină în final strategia reprezentată în Figura 9.4 prin 
muchiile continue. 


9.8  Grafuri AND/OR 


Multe probleme se pot descompune într-o serie de subprobleme, astfel încât 
rezolvarea tuturor acestor subprobleme, sau a unora din ele, să ducă la rezolvarea 
problemei inițiale. Descompunerea unei probleme complexe, în mod recursiv, în 
subprobleme mai simple poate fi reprezentată printr-un graf orientat. Această 
descompunere se numeşte reducerea problemei şi este folosită în demonstrarea 
automată, integrare simbolică şi, în general, în inteligenţa artificială. Într-un graf 
orientat de acest tip vom permite unui vârf neterminal v oarecare două alternative. 
Vârful v este de tip AND dacă reprezintă o problemă care este rezolvată doar dacă 
toate subproblemele reprezentate de vârfurile adiacente lui v sunt rezolvate. 
Vârful v este de tip OR dacă reprezintă o problemă care este rezolvată doar dacă 
cel puțin o subproblemă reprezentată de vârfurile adiacente lui v este rezolvată. 
Un astfel de graf este de tip AND/OR. 


De exemplu, arborele AND/OR din Figura 9.5 reprezintă reducerea problemei A. 
Vârfurile terminale reprezintă probleme primitive, marcate ca rezolvabile 
(vârfurile albe), sau nerezolvabile (vârfurile gri). Vârfurile neterminale reprezintă 


Secţiunea 9.8 Grafuri AND/OR 251 


Figura 9.5 Un arbore AND/OR. 


probleme despre care nu se ştie a priori dacă sunt rezolvabile sau nerezolvabile. 
Vârful A este un vârf AND (marcăm aceasta prin unirea muchiilor care pleacă din 
A), vârfurile C şi D sunt vârfuri OR. Să presupunem acum că dorim să aflăm dacă 
problema A este rezolvabilă. Deducem succesiv că problemele C, D şi A sunt 
rezolvabile. 


Într-un arbore oarecare AND/OR, următorul algoritm determină dacă problema 
reprezentată de un vârt oarecare u este rezolvabilă sau nu. Un apel sol(u) are ca 
efect parcurgerea în postordine a subarborelui cu rădăcina în u şi returnarea 
valorii true, dacă şi numai dacă problema este rezolvabilă. 


function sol(v) 
case 
v este terminal: if v este rezolvabil 
then return true 
else return false 
v este un vîrf AND: for fiecare vîrf w adiacent lui v do 
if not sol(w) then return false 
return true 
v este un vîrf OR: for fiecare vîrf w adiacent lui v do 
if sol(w) then return true 
return false 


Ca şi în cazul retezării alfa-beta, dacă în timpul explorării se poate deduce că un 
vârf este rezolvabil sau nerezolvabil, se abandonează explorarea descendenților 
săi. Printr-o modificare simplă, algoritmul sol poate afişa strategia de rezolvare a 
problemei reprezentate de u, adică subproblemele rezolvabile care conduc la 
rezolvarea problemei din u. 


Cu anumite modificări, algoritmul se poate aplica asupra grafurilor AND/OR 
oarecare. Similar cu tehnica backtracking, explorarea se poate face atât în 
adâncime (ca în algoritmul sol), cât şi în lăţime. 
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9.9 Exerciţii 


9.1 Intr-un arbore binar de căutare, care este modul de parcurgere a vârfurilor 
pentru a obţine lista ordonată crescător a cheilor? 


9.2 Fiecărei expresii aritmetice în care apar numai operatori binari i se poate 
ataşa în mod natural un arbore binar. Daţi exemple de parcurgere în inordine, 
preordine şi postordine a unui astfel de arbore. Se obţin diferite moduri de scriere 
a expresiilor aritmetice. Astfel, parcurgerea în postordine generează scrierea 
postfixată menţionată în Secțiunea 3.1.1. 


9.3 Fie un arbore binar reprezentat prin adrese, astfel încât vârful i (adică 
vârful a cărui adresă este i) este memorat în trei locaţii diferite conţinând: 


VAL[i] = valoarea vârfului 
ST[i] = adresa fiului stâng 
DR[i] = adresa fiului drept 


(Dacă se foloseşte o implementare prin tablouri paralele, atunci adresele sunt 
indici de tablou). Presupunem că variabila root conține adresa rădăcinii arborelui 
şi că o adresă este zero, dacă şi numai dacă vârful către care se face trimiterea 
lipseşte. Scrieți algoritmii de parcurgere în inordine, preordine şi postordine a 
arborelui. La fiecare consultare afişați valoarea vârfului respectiv. 


Soluție: Pentru parcurgerea în inordine apelăm inordine(root), inordine fiind 
procedura 


procedure inordine(i) 
if i + O then 
inordine(ST[i]) 
write VAL[i] 
inordine(DR[i]) 


9.4 Daţi un algoritm care foloseşte parcurgerea i) în adâncime ii) în lățime 
pentru a afla numărul componentelor conexe ale unui graf neorientat. În 
particular, puteţi determina astfel dacă graful este conex. Faceţi o comparaţie cu 
algoritmul din Exerciţiul 3.12. 


9.5 Intr-un graf orientat, folosind principiul parcurgerii în lăţime, elaboraţi un 
algoritm care găseşte cel mai scurt ciclu care conţine un anumit vârf dat. In locul 
parcurgerii în lățime, puteţi folosi parcurgerea în adâncime? 
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9.6 Revedeţi Exerciţiul 8.8. Scrieţi un algoritm care găseşte închiderea 
tranzitivă a unui graf orientat. Folosiţi parcurgerea în adâncime sau lățime. 
Comparaţi algoritmul obţinut cu algoritmul lui Warshall. 


9.7 Intr-un arbore cu rădăcină, elaboraţi un algoritm care verifică pentru două 
vârfuri oarecare v şi w, dacă w este un descendent al lui v. (Pentru ca problema să 
nu devină trivială, presupunem că vârfurile nu conţin adresa tatălui). 


Indicaţie: Orice soluţie directă necesită un timp în O(n), în cazul cel mai 
nefavorabil, unde n este numărul vârfurilor subarborelui cu rădăcina în v. 


lată un mod indirect de rezolvare a problemei, care este în principiu avantajos 
atunci când trebuie să verificăm mai multe cazuri (perechi de vârfuri) pentru 
acelaşi arbore. Fie preord[1 .. n] şi postordl! .. n] tablourile care conţin ordinea 
de parcurgere a vârfurilor în preordine, respectiv în postordine. Pentru oricare 
două vârfuri v şi w avem: 


preordlv] < preordlw] o w este un descendent al lui v, 
sau v este la stânga lui w în arbore 


postordlv] > postordlw] o w este un descendent al lui v, 
sau v este la dreapta lui w în arbore 


Deci, w este un descendent al lui v, dacă și numai dacă: 
preordlv] < preordlw] şi  postordlv] > postordlw] 


După ce calculăm valorile preord şi postord într-un timp în O(n), orice caz 
particular se poate rezolva într-un timp în (1). Acest mod indirect de rezolvare 
ilustrează metoda precondiţionării. 


9.8 Fie A arborele parțial generat de parcurgerea în adâncime a grafului 
neorientat conex G. Demonstraţi că, pentru orice muchie (v,w) din G, este 
adevărată următoarea proprietate: v este un descendent sau un ascendent al lui w 
în A. 


Soluţie: Dacă muchiei (v, w} îi corespunde o muchie în A, atunci proprietatea 
este evident adevărată. Putem presupune deci că vârfurile v şi w nu sunt adiacente 
în A. Fără a pierde din generalitate, putem considera că v este vizitat înaintea lui 
w. Parcurgerea în adâncime a grafului G înseamnă, prin definiţie, că explorarea 
vârfului v nu se încheie decât după ce a fost vizitat şi vârful w (ţinând cont de 
existența muchiei (v, w)). Deci, v este un ascendent al lui w în A. 9.9 Dacă v 
este un vârf al unui graf conex, demonstrați că v este un punct de articulare, dacă 
şi numai dacă există două vârfuri a şi b diferite de v, astfel încât orice drum care 
îl conectează pe a cu b trece în mod necesar prin v. 
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9.10 Fie G un graf neorientat conex, dar nu şi biconex. Elaboraţi un algoritm 
pentru găsirea mulțimii minime de muchii care să fie adăugată lui G, astfel încât G 
să devină biconex. Analizaţi algoritmul obţinut. 


9.11 Fie M[1 ..n, 1..n] o matrice booleană care reprezintă un labirint în 
forma unei table de şah. În general, pornind dintr-un punct dat, este permis să 
mergeţi către punctele adiacente de pe aceeași linie sau coloană. Prin punctul (i, j) 
se poate trece dacă și numai dacă M(i,j) este true. Elaboraţi un algoritm 
backtracking care găseşte un drum între colţurile (1, 1) şi (n, n), dacă un astfel de 
drum există. 


9.12 În algoritmul perm de generare a permutărilor, înlocuiţi “urilizează(T)” cu 
“write T ” şi scrieți rezultatul afişat de perm(1), pentru n = 3. Faceţi apoi acelaşi 
lucru, presupunând că tabloul T este iniţializat cu [n, n-1, ..., 1]. 


9.13 (Problema submulțimilor de sumă dată). Fie mulţimea de numere pozitive 
W= {w}, o... w,} şi fie M un număr pozitiv. Elaboraţi un algoritm backtracking 


care găseşte toate submulțimile lui W pentru care suma elementelor este M. 


Indicaţie: Fie W = (11, 13, 24,7) şi M= 31. Cel mai important lucru este cum 
reprezentăm vectorii care vor fi vârfurile arborelui generat. lată două moduri de 
reprezentare pentru soluția (11, 13, 7): 


i) Prin vectorul indicilor: (1, 2, 4). În această reprezentare, vectorii soluție au 
lungimea variabilă. 

ii) Prin vectorul boolean x = (1, 1, 0, 1), unde x[i] = 1, dacă și numai dacă w, a 
fost selectat în soluţie. De această dată, vectorii soluţie au lungimea 
constantă. 


9.14 Un cal este plasat în poziţia arbitrară (i, j), pe o tablă de şah de n x n 


pătrate. Concepeţi un algoritm backtracking care determină nl mutări ale 
calului, astfel încât fiecare poziţie de pe tablă este vizitată exact o dată 
(presupunând că o astfel de secvenţă de mutări există). 


9.15 Găsiți un algoritm backtracking capabil să transforme un întreg n într-un 
întreg m, aplicând cât mai puţine transformări de forma f(i) = 3i şi g(i) = Li/2]. De 
exemplu, 15 poate fi transformat în 4 folosind patru transformări: 4 = gfgg(15). 
Cum se comportă algoritmul dacă este imposibil de transformat astfel n în m ? 
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9.16 Modificaţi algoritmul rec pentru jocul nim, astfel încât să returneze un 
întreg k: 


i) k= 0, dacă poziţia este de pierdere. 
ii) 1SKk<]j, dacă “a lua k bețe” este o mutare de câștig. 


9.17 Jocul lui Grundy seamănă foarte mult cu jocul nim. Iniţial, pe masă se află 
o singură grămadă de n bețe. Cei doi jucători au alternativ dreptul la o mutare. O 
mutare constă din împărțirea uneia din grămezile existente în două grămezi de 
mărimi diferite (dacă acest lucru nu este posibil, adică dacă toate grămezile 
constau din unul sau două bețe, jucătorul pierde partida). Ca şi la nim, remiza este 
exclusă. Găsiţi un algoritm care să determine dacă o poziţie este de câştig sau de 
pierdere. 


9.18 Tehnica minimax modelează eficient, dar în același timp şi simplist, 
comportamentul unui jucător uman. Una din presupunerile noastre a fost că nici 
unul dintre jucători nu greşeşte. În ce măsură rămîne valabilă această tehnică dacă 
admitem că: i) jucătorii pot să greşească, ii) fiecare jucător nu exclude 
posibilitatea ca partenerul să facă greșeli. 


9.19 Dacă graful obţinut prin reducerea unei probleme are şi vârfuri care nu 
sunt de tip AND sau de tip OR, arătaţi că prin adăugarea unor vârfuri fictive 
putem transforma acest graf într-un graf AND/OR. 


9.20 Modificaţi algoritmul sol pentru a-l putea aplica grafurilor AND/OR 
oarecare. 


10. Derivare publică, 
funcţii virtuale 


Derivarea publică şi funcţiile virtuale sunt mecanismele esenţiale pentru 
programarea orientată pe obiect în limbajul C++. Cele două exemple prezentate în 
acest capitol au fost alese pentru a ilustra nu numai eleganța deosebită a 
programării orientate pe obiect, ci și problemele care pot apare atunci când se fac 
greşeli de proiectare. 


10.1 Ciurul lui Eratostene 


Acest exemplu este construit pornind de la un cunoscut algoritm pentru 
determinarea numerelor prime. Geograful şi astronomul grec Eratostene din 
Cirena (sec. III a.Ch.) a avut ideea de a transforma proprietatea numerelor prime 
de a nu fi multiplii nici unuia din numerele mai mici decât ele, într-un criteriu de 
selecţie (cernere): din şirul primelor primelor n numere naturale se elimină pe 
rând multiplii lui 2, 3, 5 etc, elementele rămase fiind cele prime. Astfel, 2 fiind 
prim, din şir se elimină multiplii lui 2 adică 4, 6, 8 etc. Următorul număr rămas 
este 3, deci 3 este prim şi se vor elimina numerele 9, 15, 21 etc, multiplii pari ai 
lui 3 fiind deja eliminați. Și aşa mai departe, până la determinarea tuturor 
numerelor prime mai mici decât un număr dat. 


Implementarea ciurului lui Eratostene prezentată în continuare” nu este foarte 
eficientă ca timp de execuţie şi memorie utilizată. În schimb, este atât de 
“orientată pe obiect”, încât merită să fie prezentată ca una din cele mai tipice 
aplicaţii C++. Ciurul este construit dintr-un şir de sife şi un generator de numere 
numit contor. Fiecare sită corespunde unui număr prim. Ea solicită valori 
(numere) de cernut de la sita următoare şi lasă să treacă, returnând sitei 
anterioare, doar acele valori care nu sunt multipli ai numărului prim corespunzător 
sitei. Ultimul element în această structură de site este contorul, care nu face decât 
să genereze numere, rând pe rând. Primul element este ciurul propriu-zis, din care 
vor ieşi doar numere prime. În plus, ciurul mai are sarcina de a crea sita 
corespunzătoare numărului prim tocmai determinat. 


La început, avem doar ciurul și contorul, acesta din urmă iniţializat cu valoarea 2 
(Figura 10.1). Prima valoare extrasă din ciur este şi prima valoare returnată de 


Implementarea este preluată din R. Sethi, “Programming Languages. Concepts and Constructs”, 
Secţiunea 6.7. 
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Figura 10.1 Ciurul lui Eratostene. 


contor, şi anume 2. După această primă iterație, contorul va avea valoarea 3, iar 
între ciur şi contor se va insera prima sită, sită corespunzătoare lui 2. Ciurul va 
solicita o nouă valoare sitei 2 care, la rândul ei, va solicita o nouă valoare 
contorului. Contorul emite 3, schimbându-și valoarea la 4, 3 va trece prin sita 2 şi 
va ajunge la ciur. Imediat, sita 3 se inserează în lista existentă. 


Contorul, la solicitarea ciurului, solicitare transmisă sitei 3, apoi sitei 2, va 
returna în continuare 4. Valoarea 4 nu trece de sita 2, dar sita 2 insistă, căci 
trebuie să răspundă solicitării primite, astfel încât va primi un 5. Această valoare 
trece de toate sitele şi lista are un nou element. Continuând procesul, constatăm că 
6 se blochează la sita 2, 7 trece prin toate sitele (5, 3, 2), iar valorile 8 şi 9 sunt 
blocate de sitele 2, respectiv 3. La un moment dat, contorul va avea valoarea n, 
iar în listă vor fi sitele corespunzătoare tuturor numerelor prime mai mici decât n. 


Pentru implementarea acestui comportament, avem nevoie de o listă înlănțuită, în 
care fiecare element este sursă de valori pentru predecesor şi îşi cunoaşte propria 
sursă (elementul succesor). Altfel spus, fiecare element are cel puţin doi membri: 
adresa sursei şi funcţia care cerne valorile. 


class element { 

public: 
element ( element *src ) { sursa = src; |) 
virtual int cerne( ) { return 0; ) 


protected: 
element *sursa; 


); 


Acest element este un prototip, deoarece lista conţine trei tipuri diferite de 
elemente, diferenţiate prin funcţia de cernere: 
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e Ciurul, care creează site. 
e  Sitele, care cern valorile. 


e  Contorul, care doar generează valori. 


Cele trei tipuri fiind particularizări ale tipului element, le vom deriva public din 
acesta, creând astfel trei subtipuri. 


class contor: public element { 

public: 
contor( int v ): element( 0 ) { valoare = v; ) 
int cerne( ) ( return valoarerr; |; 


private: 
int valoare; 


); 


class ciur: public element | 

public: 
ciur( element *src ): elementi( sre ) { } 
int cerne( ); 


); 


class sita: public element | 

public: 
sita( element *src, int f ): element (src) { factor = f; ) 
int cerne( ); 


private: 
int factor; 
); 


Clasa contor este definită complet. Primul element generat (“cernut”) este stabilit 
prin v, parametrul constructorului. Pentru clasa sita, funcția de cernere este mult 
mai selectivă. Ea solicită de la sursă valori, până când primeşte o valoare care nu 
este multiplu al propriei valori. 


int sita::cerne( ) { 
while (1) 4 
int n = sursa->cerne | ); 
if |n $% factor |) return ns 


Pentru ciur-ul propriu-zis, funcția de cernere nu mai are nimic de cernut. 
Valoarea primită de la sita sursă este în mod sigur un număr prim, motiv pentru 
care ciur-ul va crea sita corespunzătoare. 
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int ciur cerne ) { 
int n = sursa->cerne( ); 
sursa = new sita( sursa, n ); 
return n; 


) 
Se observă că noua sită este creată şi inserată în ciur printr-o singură instrucțiune: 


sursa = new sita( sursa, n ); 


al cărei efect poate fi exprimat astfel: sursa nodului ciur este o nouă sita (cu 
valoarea n) a cărei sursă va fi sursa actuală a ciurului. O astfel de operaţie de 
inserare este una dintre cele mai uzuale în lucrul cu liste. 


Prin programul următor, ciurul descris poate fi pus în funcțiune pentru 
determinarea numerelor prime mai mici decât o anumită valoare. 


tinclude <iostream.h> 

tinclude <stdlib.h> 

+include <new.h> 

// definitiile claselor element, contor, ciur, sita 


void no_memi ) { cerr << "no mem; exit 1 )ș |] 


int maini ) { 
_new_handler = no_mem; 
int max; 
cout << Tmax s+. Ms in >> Mass 


ciur sai 4contori 2 } J7 
int prim; 


do { 
prim = s.cerne( ); 
cout << prim <x ! 1} 
} while ( prim < max ); 
Eat << Tint; 


return 0; 


Inainte de a introduce valori max prea mari, este bine să vă asiguraţi că stiva 
programului este suficient de mare şi că aveți suficient de multă memorie liberă 
pentru a fi alocată dinamic. 


Folosind cunoştinţele expuse până acum, această ciudată implementare a 
algoritmului lui Eratostene nu are cum să funcționeze. lată cel puţin două motive: 
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e În instrucţiunea int n = sursa->cerne( ) din clasele sita şi ciur, 
membrul sursa, moştenit de la clasa de bază element, este de tip pointer la 
element, deci funcţia cerne () invocată este cea definită în clasa element. În 
consecinţă, ceea ce se obține ar trebui să fie un şir infinit de O-uri (desigur, în 
limita memoriei disponibile). 

e Există o nepotrivire între argumentele formale (de tip pointer la element) ale 
constructorilor claselor ciur, sita şi argumentele actuale cu care sunt 
invocaţi aceşti constructori. Astfel, constructorul clasei ciur este invocat cu 
un pointer la contor, iar constructorul clasei sita este invocat prima dată cu 
un pointer la contor şi apoi cu pointeri la sita. 


Elementele esenţiale în elucidarea acestor aspecte sunt derivările publice şi 
definiția din clasa element: 


virtual int cerne( ) { return 0; ) 


Prin derivarea public, tipurile ciur, sita şi contor sunt subtipuri ale tipului de 
bază element. Conversia de la un subtip (tip derivat public) la tipul de bază este 
o conversie sigură, bine definită. Membrii tipului de bază vor fi totdeauna corect 
inițializaţi cu valorile membrilor respectivi din subtip, iar valorile membrilor din 
subtip, care nu se regăsesc în tipul de bază, se vor pierde. Din aceleaşi motive, 
conversia subtip-tip de bază se extinde şi asupra pointerilor sau referințelor. 
Altfel spus, în orice situaţie, un obiect, un pointer sau o referință la un obiect 
dintr-un tip de bază, poate fi înlocuit cu un obiect, un pointer sau o referinţă la un 
obiect dintr-un tip derivat public. 


Declaraţia virtual din funcţia cerne() permite implementarea legăturilor 
dinamice. Prin redefinirea funcţiei cerne () în fiecare din subtipurile derivate din 
element, se permite invocarea diferențiată a funcțiilor cerne () printr-o sintaxă 
unică: 


sursa->cerne ( ) 


Dacă sursa este de tip pointer la element, atunci, după cum am precizat mai sus, 
oricând este posibil ca obiectul sursa să fie dintr-un tip derivat din element. 
Funcţia cerne () fiind virtuală în tipul de bază, funcţia efectiv invocată nu va fi 
cea din tipul de bază, ci cea din tipul actual al obiectului invocator. Acest 
mecanism implică stabilirea unei legături dinamice, în timpul execuţiei 
programului, între tipul actual al obiectului invocator şi funcția virtuală. 


Datorită faptului că definiția din clasa de bază a funcției cerne (), practic nu are 
importanţă, este posibil să o lăsăm nedefinită: 


virtual int cerne( ) = 0; 
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Consecința acestei acţiuni este că nu mai putem defini obiecte de tip element, 
clasa putând servi doar ca bază pentru derivarea unor subtipuri. Astfel de funcții 
se numesc virtuale pure, iar clasele respective sunt numite clase abstracte. 


10.2 Tablouri inițializate virtual 


Tabloul, una din cele mai simple structuri de date, are drept caracteristică 
principală adresarea elementelor sale în timp constant. Regăsirea sau modificarea 
valorii unui element de tablou sunt operaţii care necesită un timp constant, 
independent de factori cum ar fi poziţia (indicele) elementului, sau faptul că este 
neinițializat, iniţializat sau chiar modificat de mai multe ori. 


Adresarea elementelor pentru citirea sau modificarea valorilor lor, operaţie 
numită indexare, este considerată operaţia fundamentală asociată structurii de 
tablou. Chiar dacă este uşor de implementat, cu un timp de execuţie constant (vezi 
operatorul de indexare din clasa tablou<T>, Secţiunea 4.1.3), uneori indexarea se 
dovedeşte a fi costisitoare. Algoritmul nim ne-a pus în faţa unei astfel de situaţii: 
tabloul init este util doar dacă poate fi nu numai adresat, ci şi inițializat în timp 
constant, timp imposibil de atins în condițiile inițializării fiecărui element prin 
operatorul de indexare. Aparent, tabloul nu se pretează la o astfel de iniţializare şi 
deci ar fi bine să lucrăm cu o altă structură. De exemplu, cu o listă a elementelor 
modificate. Valoarea oricărui element este cea memorată în listă, sau este o 
valoare implicită, dacă el nu apare aici. Iniţializarea nu mai depinde, în această 
situaţie, de numărul elementelor, dar nici adresarea nu mai este o operație cu timp 
constant de execuţie! 


Iniţializarea unui tablou în timp constant, împreună cu accesarea elementelor tot 
în timp constant, sunt două cerințe aparent contradictorii pentru structura de 
tablou. Eliminarea contradicţiei, în caz că este posibilă (şi este), impune 
completarea tabloului cu o nouă operaţie elementară, inifializarea, precum şi 
modificarea corespunzătoare a operatorului de indexare. Obţinem un alt tip de 
tablou, în care elementele nu mai sunt iniţializate efectiv, fiecare în parte, ci 
virtual, printr-un operator de inițializare globală. 


$ . > soes . . * $ 
In continuare, vom prezenta o structură de tablou inițializat virtual , precum şi 
implementarea corespunzătoare în limbajul C++. 


Ideea acestei structuri este sugerată în A. V. Aho, J. E. Hopcroft şi J. D. Ullman, “The Design and 
Analysis of Computer Algorithms”. 
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Figura 10.2 Structura de tablou iniţializat virtual. 


10.2.1 Structura 


Intreaga construcţie se bazează pe o idee similară cu mai sus menţionata listă a 
elementelor modificate. Este o idee cât se poate de naturală, completată cu o 
ingenioasă modalitate de evitare a parcurgerii secvențiale a listei. 


Tabloului inițializat virtual a i se asociază un tablou b, în care sunt memorate 
poziţiile elementelor modificate. De exemplu, dacă s-au modificat elementele 
a[31], a[0] şi a[4], atunci primele trei poziţii din b au valorile 3, O şi 4. Se 
observa că b este o listă implementată secvențial, sub forma unui tablou. 


Dacă nici o poziţie din b nu a fost ocupată, atunci orice element din a are valoarea 
implicită (stabilită apriori). Dacă b este complet ocupat, atunci toate elementele 
din a au fost modificate, deci valorile lor pot fi obținute direct din locaţiile 
corespunzătoare din a. Pentru evidenţa locaţiilor ocupate din lista b (şi implicit a 
celor libere), vom folosi variabila sb, variabilă iniţializată cu -1. 


Cum procedăm în cazul general, când doar o parte din elemente au fost 
modificate? Nu vom parcurge locaţiile ocupate din b, ci va trebui să decidem în 
timp constant dacă un anumit element, de exemplu a[l], a fost sau nu a fost 
modificat. Pentru a atinge această “performanță”, vom completa structura cu un 
alt tablou, tabloul p, în care sunt memorate poziţiile din b ale fiecărui element 
modificat (Figura 10.2). 


Tabloul p, tablou paralel cu tabloul a, se inițializează pe măsură ce elementele din 
a sunt modificate. În exemplul nostru, p[3] este 0 deoarece elementul a[3] a fost 
modificat primul, ocupând astfel prima poziţie în b. Apoi, p[0] este 1 pentru că 
a[0] este al doilea element modificat, iar p[4] are valoarea 2 deoarece al treilea 
element modificat a fost a[4]. Valoarea lui a[1], valoare nemodificată, se obţine 
prin intermediul tablourilor p şi b astfel: 
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e Dacă p[1] nu este o poziţie validă în b, adică 0 > p[1] sau p[1] > sb, atunci 
a[1] nu a fost modificat şi are valoarea implicită. 


e Dacă p[1] este o poziţie validă în b, atunci, pentru ca a[1] să nu aibă valoarea 
implicită, b[p[1]] trebuie să fie 1. Deoarece a[1] nu a fost modificat, nici o 
poziție ocupată din b nu are însă valoarea 1. Deci, a[1] are valoarea implicită. 


Să vedem acum ce se întâmplă pentru un element deja modificat, cum este a[0]. 
Valoarea lui p[0] corespunde unei poziţii ocupate din b, iar b[p[0]] este 0, deci 
a[0] nu are valoarea implicită. 


10.2.2 Implementarea (o variantă de nota şase) 


Tabloul inițializat virtual cu elemente de tip T, tablouvI<T> (se poate citi chiar 
“tablou şase”), este o clasă cu o funcţionalitate suficient de bine precizată pentru 
a nu pune probleme deosebite la implementare. Vom vedea ulterior că apar totuşi 
anumite probleme, din păcate majore şi imposibil de ocolit. Până atunci, să 
stabilim însă structura clasei tablouvI<T>. Fiind, în esenţă, vorba tot de un 
tablou, folosim clasa tablou<T> ca tip public de bază. Altfel spus, tablouvI<T> 
este un subtip al tipului tablou<T> şi poate fi folosit oricând în locul acestuia. 
Alături de datele moştenite de la tipul de bază, noua clasă are nevoie de: 


e Cele două tablouri auxiliarep şi b. 
e Întregul sb, contorul locaţiilor ocupate din b. 


e Elementul vi, în care vom memora valoarea implicită a elementelor tabloului. 


A 


In privința funcțiilor membre avem nevoie de: 


e Un constructor (constructorii nu se moştenesc), pentru a dimensiona tablourile 
şi a fixa valoarea implicită. 

e O funcţie (operator) de inițializare virtuală, prin care, în orice moment, să 
“inițializăm” tabloul. 

e Un operator de indexare. 


A 


În mare, structura clasei tablouVI<T> este următoarea: 


template <class T> 
class tablouVI: publie tablou<T> { 
public: 

tablouVI ( int, T )} 


tablouVI& operator =( TI); 
T& operator []( int ); 
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private: 
T a 3, // valoarea implicita 


tablou<int> p; b; // tablourile auxiliare p si b 
int sb; // pointer in b 
}; 


unde operatorul de atribuire este cel care realizează ințializarea virtuală a 
tabloului. 


Indexarea este operația cea mai dificil de implementat. Dificultatea provine din 
necesitatea de a-i conferi acestui operator o funcționalitate similară celui din clasa 
tablou<T>, în sensul de a putea fi folosit atât pentru returnarea valorii 
elementelor, cât şi pentru modificarea lor. Pentru a nu complica în mod inutil 
implementarea, convenim ca primul acces la fiecare element să implice şi 
inițializarea elementului respectiv cu valoarea implicită. În consecință, 
modificarea valorii unui element se realizează prin simpla returnare a referinței 
elementului. Operatorul de indexare este implementat astfel: 


template<class T> 
Té tablouVi<T>::operator []( int îi) { 
statig È 2; // elementul returnat in caz de eroare 


// verificarea indicelui i 


if (isoli d} i 
cerr << "inintablouIV -== "<< g 
e "e indice eronat: << I <a "Anin"; 


return z; 


) 


// returnarea valorii elementului i 
int kep i I} 
if ( 0 <= k && k <= sb && b[ k ] == i ) 
// element deja initializat 
return al i |]; 


else 
// elementul se initializeaza cu valoarea implicita 
return al bl pl 1 ] = ++sb ] =i ] = vi; 


Operatorul de atribuire implementat mai jos poate fi oricând invocat pentru 
inițializarea virtuală. Argumentul lui este valoarea implicită asociată tuturor 
elementelor tabloului: 
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template<class T> 

tablouvI<T>s tablouvI<T>::operator =( Iv) | 
vi = yý sb = =l} 
return *this; 


De asemenea, putem realiza iniţializarea virtuală şi prin intermediul 
constructorului clasei tablouvI<T>: 


template<class T> 
tablouvrIs<T>i:tablouvI( int ny T 
tablousT>{ n Jy Yil 


v) 
viy Pi n jy BDI 4, Sbi =) { 


} 
Operaţiile de inițializare a obiectelor prin constructori constituie una din cele mai 


bine fundamentate părți ale limbajului C++. Pentru clasa tablou<T>, inițializarea 
elementelor tabloului este ascunsă în constructorul 


template<class T> 
tablou<T>::tablou( int dim) { 


a 0y 0z d 0; // valori implicite 
1f 4 dam >03) // verificarea dimensiunii 
a = new T [ d = dim |]; // alocarea memoriei 


constructor invocat prin lista de inţializare a membrilor din constructorul clasei 
tablouvI<T>. Mai exact, expresia new T[ d ] are ca efect invocarea 
constructorului implicit al tipului T, pentru fiecare din cele d elemente alocate 
dinamic. Acest comportament (absolut justificat) al operatorului new este total 
inadecvat unei inițializări în timp constant. Ne întrebăm dacă putem doar aloca 
spaţiul, fără a-l şi inţializa. Dacă tipul T nu are nici un constructor, atunci 
inițializarea spaţiului alocat este inutilă, deoarece acest tip admite obiecte 
neinițializate. Dar, dacă tipul T are cel puţin un constructor, atunci înseamnă că 
obiectele de tip T nu pot fi neiniţializate şi, în consecință, este necesar un 
constructor implicit (apelabil fără nici un argument) pentru a iniţializa spațiul 
alocat prin new. Astfel, am ajuns la primul motiv pentru care această 
implementare este doar de nota şase: tabloul tablouvI<T> este (virtual) inițializat 
în timp constant, numai dacă tipul T nu are constructor, altfel spus, dacă permite 
lucrul cu obiecte neinițializate. 


Problema pe care ne-o punem acum este în ce măsură responsabilitatea verificării 
acestei condiţii poate fi preluată de compilator sau de proiectantul clasei 
tablouvI<T>. Compilatorul poate semnala, în cel mai bun caz, absenţa 
constructorului implicit. Proiectantul nu este nici el într-o situație mai bună, 
deoarece: 
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e Nu poate modifica comportamentul operatorului new astfel încât să nu mai 
invoce constructorul implicit. 


e Prezența (sau absența) constructorilor clasei T nu poate fi verificată în timpul 
rulării programului. 


Soluţia este reproiectarea clasei, pentru a se obține o variantă mai puţin naivă. De 
exemplu, în tabloul propiu-zis, se pot memora adresele elementelor, şi nu 
elementele. 


Obiectele de tip tablouvI<T> generează necazuri și în momentul în care 
încetează să mai existe. Ştim că, în aceste situaţii, se vor invoca destructorii 
datelor membre şi cel al clasei de bază (în această ordine). Ajungem din nou la 
clasa tablou<T> şi la destructorul acesteia: 


-tablou( ) { delete [ ] a; ) 


care invocă destructorul clasei T (în caz că T are destructor) pentru fiecare obiect 
alocat la adresa a. Efectele destructorului asupra obiectelor care nu au fost 
niciodată iniţializate sunt greu de prevăzut. Rezultă că prezenţa destructorului în 
clasa T este chiar periculoasă, spre deosebire de prezenţa constructorului care va 
genera doar pierderea timpului constant de iniţializare. 


Continuând analiza deficienţelor clasei tablouIV<T>, ajungem la banala operaţie 
de atribuire a[ i ] = vi din operatorul de indexare. Dacă tipul T are un operator 
de atribuire, atunci acest operator consideră obiectul invocator (cel din membrul 
drept) deja inițializat și va încerca să-l distrugă în aceeași manieră în care 
procedează şi destructorul. În cazul nostru, premisa este contrară: a[ i ] nu este 
inițializat, deci nu ne trebuie o operaţie de atribuire, ci una de iniţializare a 
obiectului din locaţia a[ i ] cu valoarea vi. lată un nou argument în favoarea 
utilizării unui tablou de adrese şi nu a unui tablou de obiecte. 


Fără a mai conta la nota acordată, să observăm că operaţiile de iniţializare şi de 
atribuire între obiecte de tip tablouvI<T> sunt nu numai generatoare de surprize 
(neplăcute), ci şi foarte ineficiente. Surprizele sunt datorate constructorilor şi 
destructorilor clasei T şi au fost analizate mai sus. Ineficiența se datorează 
faptului că nu este necesară parcurgerea în întregime a tablourilor implicate în 
transfer, ci doar parcurgerea elementelor purtătoare de informaţie (iniţializate). 
Cauza acestor probleme este operarea membru cu membru în clasa tablouvI<T>, 
prin intermediul constructorului de copiere şi al operatorului de atribuire din clasa 
tablou<T>. 


Concluzia este că tabloul inițializat virtual generează o mulțime de probleme. 
Aceasta, deoarece procesul de iniţializare şi cel opus, de distrugere, sunt tocmai 
elementele imposibil de ocolit în semantica structurilor de tip clasă din limbajul 
C++. Implementarea prezentată, chiar dacă este doar de nota şase, poate fi 
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utilizată cu succes pentru tipuri de date predefinite, sau care nu necesită 
constructori şi destructori. De asemenea, se vor evita operaţiile de copiere 
(inițializări, atribuiri, transmiteri de parametri prin valoare) între obiectele de 
acest tip. 


10.2.3 tablouvI<T> ca subtip al tipului tablou<T> 


Derivarea publică instituie o relaţie specială între tipul de bază şi cel derivat. 
Tipul derivat este un subtip al celui de bază, putând fi astfel folosit oriunde este 
folosit şi tipul de bază. Această flexibilitate se bazează pe o conversie standard a 
limbajului C++, şi anume conversia de la tipul derivat public către tipul de bază. 


Prin funcționalitatea lui, tabloul inițializat virtual este o particularizare a 
tabloului. Decizia de a construi tipul tablouvI<T> ca subtip al tipului tablou<T> 
este deci justificată. Simpla derivare publică nu este suficientă pentru a crea o 
veritabilă relaţie tip-subtip. De exemplu, să considerăm următorul program pentru 
testarea clasei tablouvI<T>. 


tinclude <iostream.h> 
tinclude "tablouvI.h" 


// declaratie necesara pentru a evita 
// referirea la sablon - vezi Sectiunea 4.1.3 
ostream& operator <<( ostreame, tablou<int>& ); 


main( ) 4 
cout << "nTablou (de intregi) initializat virtual." 
<< "nNumarul elementelor, valoarea implicita ... "; 


int n, v; cin >> n >> yi 
tablouvI<xint> x6( ñ; vY J} 


cout << "\nIndicele, valoarea (prin indicele -1 se\n" 


<< T modifica valoarea implicita) <EOF>:1n..."; 
while cin >> n >> y} | 
if (n == -1 ) x6 = v; else x6[ n ] = v; 
SOUE SA Trea PA 


} 


cin.clear( ); 


cout << Tin’ €< x6 <4 The 
return 1; 


Acest program este corect, dar valorile afişate nu sunt cele care ar trebui să fie. 
Cauza este operatorul de indexare [] din tablou<T>, operator invocat în funcția 
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template <class T> 


ostream& operator <<( ostreamâ& os, tablou<T>& t ) 4 
int n = t.size( ); 
os e " p" er n PRA #7 : ma 
for { int 1 = Q} 1 < n; 05 << t i++ ] &< T T Jå 


return os; 


) 


prin intermediul argumentului t. Noi dorim ca, atunci când t este de tip 
tablouvI<T>, operatorul de indexare [] invocat să fie cel din clasa 
tablouvI<T>. De fapt, ceea ce urmărim este o legare (selectare) dinamică, în 
timpul rulării programului, a operatorului [] de tipul actual al obiectului 
invocator. Putem obţine acest lucru declarând virtual operatorul de indexare din 
clasa tablou<T>: 


template <class T> 
class tablou { 


virtual Té operator []( int ); 
FA 
); 


O funcție declarată virtual într-o clasă de bază este o funcţie a cărei 
implementare depinde de tip, în sensul că va fi reimplementată pentru unele din 
tipurile derivate. Atunci când se invocă printr-o referință sau pointer la clasa de 
bază, funcţia virtuală permite selectarea variantei sale redefinite pentru tipul 
actual al obiectului invocator. În cazul nostru, operatorii de indexare au fost 
redefiniţi în clasa derivată tablouvI<T>. Deci, prin declararea ca funcţii virtuale 
în clasa de bază, se realizează legarea lor dinamică de tipul actual al obiectului 
invocator. 


Moștenirea şi legăturile dinamice sunt atributele necesare programării orientate pe 
obiect. Limbajul C++ suportă aceste facilităţi prin mecanismul de derivare al 
claselor şi prin funcţiile virtuale. Un alt element util programării orientate pe 
obiect este obţinerea de informaţii asupra claselor în timpul rulării programului 
(RTTI sau Run-Time Type Information). lată o situaţie simplă, în care avem 
nevoie de RTTI. Fie următoarea funcție pentru interschimbarea a două tablouri: 


template <class T> 

void swap( tablou<T>& a, tablou<T>s b ) | 
tablou<T> tmp = a; 
a = b; 
b = tmp; 
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Pentru a o invoca, putem utiliza orice argumente de tip tablou<T> sau 
tablouvI<T>. Nu este însă logic să interschimbăm un tablouvI<T> cu un 
tablou<T>. Detectarea acestei situaţii (corectă din punct de vedere sintactic) se 
poate face numai în momentul rulării programului, prin RTTI. Limbajul C++ nu 
are facilități proprii pentru RTTI, dar permite implementarea lor prin mecanismul 
funcţiilor virtuale. Multe din bibliotecile C++ profesionale oferă facilități 
sofisticate de RTTI. Pentru exemplul de mai sus, am implementat o variantă 
primitivă de RTTI. Este vorba de introducerea funcţiilor virtuale tip () în clasele 
tablou<T> şi tablouvI<T>, funcţii care returnează codurile de identificare ale 
claselor respective. 


template <class T> 
class tablou { 


virtual char tipi | const | return 'T"; } 
// 
); 


template <class T> 

class tablouVI: public tablou<T> { 
public: 

// 

char tipi ) const { return y": ) 
ff 

); 


Deci, vom introduce în funcţia swap( tablou<T>&, tablou<T>& ) secvenţa de 
test a tipurilor implicate: 


template <class T> 
void swap( tablou<T>& a, tablou<T>s b y | 


if (a.tipi ) I= bitipt j ) 
cerr << "in\nswap == tablouri de tipuri diferite. \nyn"; 
else { 


tablou<T> tmp a; a b; b tmp; 
} 


Am reuşit, astfel, să prevenim anumite operații corecte sintactic, dar imposibil de 
aplicat obiectelor din tipurile derivate. 


Mecanismul RTTI trebuie folosit cu mult discernământ. Este mai bine să prevenim 
situații ca cea de mai sus, decât să le soluționăm prin “artificii” (de tip RTTD care 
pot duce la pierderea generalității funcțiilor sau claselor respective. 
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10.3 Exerciţii 


10.1 Dacă toate elementele unui tablou iniţializat virtual au fost modificate, 
atunci testarea stării fiecărui element prin tablourile p şi b este inutilă. Mai mult, 
spaţiul alocat tablourilor p şi b poate fi eliberat. 


Modificaţi operatorul de indexare al clasei tablouvI<T> astfel încât să trateze şi 
situația de mai sus. 


10.2 Operatorul de indexare al clasei tablouvI<T> iniţializează fiecare 
element cu valoarea implicită, chiar la primul acces al elementului respectiv. 
Procedeul este oarecum ineficient, deoarece memorarea valorii unui element are 
sens doar dacă această valoare este diferită de valoarea implicită. 


Completaţi clasa tablouvI<T> astfel încât să fie memorate efectiv doar valorile 
diferite de valoarea implicită. 


10.3 Ceea ce diferenţiază operatorul de indexare din clasa tablouvI<T> faţă 
de cel din clasa tablou<T> este, în cele din urmă, verificarea indicelui: 


e în clasa tablou<T> este o vorba de o simplă încadrare între O şi d 


e în clasa tablouvI<T> este un algoritm care necesită verificarea corelaţiilor 
dintre tablourile p şi b. 


Implementaţi precedura virtuală check ( int ) pentru verificarea indicelui în 
cele două clase şi modificaţi operatorul de indexare din clasa tablou<T> astfel 
încât operatorul de indexare din clasa tablouvI<T> să nu mai fie necesar. 


10.4  Implementaţi constructorul de copiere, operatorul de atribuire şi funcţia 
de redimensionare pentru obiecte de tip tablouvI<T>. 


Epilog 


De la înmulţirea “a la russe” până la grafurile AND/OR am parcurs de fapt o mică 
istorie a gândirii algoritmice. Am pornit de la regulile aritmetice din Antichitate și 
am ajuns la modelarea raționamentului uman prin inteligenţa artificială. Acestă 
evoluţie spectaculoasă reflectă, de fapt, evoluţia noastră ca fiinţe raționale. 


S-ar putea ca paşii făcuți să fi fost uneori prea mari. La aceasta a dus dorința 
noastră de a acoperi o arie suficient de largă. Pe de altă parte, este şi efectul 
obiectului studiat: eleganța acestor algoritmi impune o exprimare concisă. Mai 
mult, limbajul C este cunoscut ca un limbaj elegant, iar limbajul C++ accentuază 
această caracteristică. Interesant acest fenomen prin care limbajul ia forma 
obiectului pe care îl descrie. Cartea noastră este, în mod ideal, ea însăşi un 
algoritm, sau un program C++. 


Este acum momentul să dezvăluim obiectivul nostru secret: am urmărit ca, la un 
anumit nivel, implementarea să fie cât mai apropiată de pseudo-cod. Detaliile 
legate de programarea orientată pe obiect devin, în acest caz, neimportante, 
utilizarea obiectelor fiind tot atât de simplă ca invocarea unor funcţii de 
bibliotecă. Pentru a ajunge la această simplitate este necesar ca cineva să 
construiască bine clasele respective. Cartea noastră reprezintă un prim ghid pentru 
acel “cineva”. 


Nu putem încheia decât amintind cuvintele lui Wiston Churchill referitoare la 
bătălia pentru Egipt: 


Acesta nu este sfârşitul. 

Nu este nici măcar începutul. 
Dar este, poate, sfărșitul 
începutului. 
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